完全信息動態(tài)博弈(博弈論與信息經(jīng)濟學(xué))課件

上傳人：v*** IP屬地：貴州上傳時間：2022-12-03 格式：PPTX 頁數(shù)：137 大?。?56.96KB 積分：25 舉報 版權(quán)申訴

完全信息動態(tài)博弈(博弈論與信息經(jīng)濟學(xué))課件_第2頁

完全信息動態(tài)博弈(博弈論與信息經(jīng)濟學(xué))課件_第3頁

完全信息動態(tài)博弈(博弈論與信息經(jīng)濟學(xué))課件_第4頁

完全信息動態(tài)博弈(博弈論與信息經(jīng)濟學(xué))課件_第5頁

已閱讀5頁，還剩132頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認(rèn)領(lǐng)

文檔簡介

第二章完全信息動態(tài)博弈博弈的擴展式表述子博弈精煉納什均衡子博弈精煉納什均衡舉例重復(fù)博弈和無名氏定理第二章完全信息動態(tài)博弈博弈的擴展式表述第一節(jié)博弈的擴展式表述第一節(jié)博弈的擴展式表述完全信息動態(tài)博弈一般以擴展型式來表示：G=(N,H,P,I,U)，包括5要素：（1）局中人N；（2）歷史H:博弈樹是一個多環(huán)節(jié)與枝干的集合，從單一的起始環(huán)節(jié)，直到終結(jié)環(huán)節(jié)，代表博弈歷史；（3）對每個環(huán)節(jié)的分配法則P:將每個環(huán)節(jié)（除終結(jié)環(huán)節(jié)外）分配給不同的局中人，并賦予行動時可選的策略；（4）局中人行動時的信息集合I；（5）對應(yīng)局中人可能選擇策略，各局中人在終結(jié)環(huán)節(jié)所得到的報酬U。完全信息動態(tài)博弈一般以擴展型式來表示：G=(N,H,P,I,122LLSSLS（2，2）（-1，-1）（-1，-1）（1，1）戰(zhàn)略式表述(strategicformrepresentation)多用矩陣2,2-1,-1-1,-11,12LSLS1擴展式表述(extensiveformrepresentation)多用博弈樹戰(zhàn)略式與擴展式122LLSSLS（2，2）（-1，-1）（-1，-1）（1-3，-3-3，-31，01，00，10，00，10，0AB（進入，進入）進入不進入（進入，不進入）（不進入，進入）（不進入，不進入）市場進入博弈的標(biāo)準(zhǔn)式進入不進入ABB進入不進入不進入進入收益：AB-3，-31，00，10，0市場進入的擴展式-3，-3-3，-31，01，00，10，00在市場進入博弈中：A有兩個行動：“進入”、“不進入”。由于是先行動者，只有兩個戰(zhàn)略：選擇“進入”或“不進入”。

B有兩個行動：“進入”、“不進入”。但是，有4個戰(zhàn)略：(1)若A選擇“進入”，B選擇“進入”，若A選擇“不進入”，B選擇“進入”，即

（進入，進入）(2)若A選擇“進入”，B選擇“進入”，若A選擇“不進入”，B選擇“不進入”，即

（進入，不進入）(3)若A選擇“進入”，B選擇“不進入”，若A選擇“不進入”，B選擇“不進入”，即（不進入，進入）(4)若A選擇“進入”，B選擇“不進入”，若A選擇“不進入”，B選擇“不進入”，即（不進入，不進入）在市場進入博弈中：A有兩個行動：“進入”、“博弈樹的構(gòu)成1．結(jié)(nodes)：結(jié)包括決策結(jié)(decitionnodes)和終點結(jié)(terminalnodes)兩類。決策結(jié)是參與人采取行動的時點，終點結(jié)是博弈行動路徑的終點。在博弈樹中，“誰在什么時候行動”用在決策結(jié)旁邊標(biāo)注參與人的辦法來表示。參與人的支付標(biāo)注在博弈樹終點結(jié)處。2．枝(branches)：在博弈樹上，枝是從一個決策結(jié)到它的直接后續(xù)結(jié)的連線，每一個枝代表參與人的一個行動選擇。3．信息集(informationsets)：博弈樹上的所有決策結(jié)分割成不同的信息集。每一個信息集是決策結(jié)集合的一個子集。該子集包括所有滿足下列條件的決策結(jié)：(1)每一個決策結(jié)都是同一參與人的決策結(jié)；(2)該參與人知道博弈進入該集合的的某個決策結(jié)，但不知道自己究竟處于哪一個決策結(jié)。博弈樹的構(gòu)成1．結(jié)(nodes)：結(jié)包括決策結(jié)(decit122LLSSLS（2，2）（-1，-1）（-1，-1）（1，1）

結(jié)nodes信息集分單節(jié)信息集和多節(jié)信息集；如果用虛線匡起來表示2知道自己位于信息集內(nèi)，但不知道是哪一點，因為他沒能觀察到對手的行動；如果博弈樹的所有信息集都是單結(jié)的，稱為完美信息博弈122LLSSLS（2，2）（-1，-1）（-1，-1）（1122LLSSLS（2，2）（-1，-1）（-1，-1）（1，1）完美信息（perfectinformation）與

不完美信息(imperfectinformation)122LLSSLS（2，2）（-1，-1）（-1，-1）（1，1）不完美信息：2不能區(qū)分1是采用了L還是S完美信息：2能區(qū)分1是選擇了L還是S122LLSSLS（2，2）（-1，-1）（-1，-1）（1第二節(jié)

子博弈精煉納什均衡子博弈子博弈精煉納什均衡求解方法：逆向歸納法承諾行動與子博弈精煉納什均衡第二節(jié)

子博弈精煉納什均衡子博弈一、子博弈（sub-game）子博弈定義：在一個擴展型博弈中，如果一個博弈由它的一個決策結(jié)及其所有后續(xù)結(jié)構(gòu)成，并滿足（1）起始結(jié)是一個單結(jié)的信息結(jié);（2）子博弈保留了原博弈的所有結(jié)構(gòu)，則稱它為原博弈的一個子博弈（子博弈）。一、子博弈（sub-game）子博弈定義：在一個擴展型博弈中（1）起始結(jié)是一個單結(jié)的信息結(jié)122LLSSLS（2，2）（-1，-1）（-1，-1）（1，1）122LLSSLS（2，2）（-1，-1）（-1，-1）（1，1）x1x2（1）起始結(jié)是一個單結(jié)的信息結(jié)122LLSSLS（2，2）（（2）子博弈保留了原博弈的所有結(jié)構(gòu)：子博弈的信息集和支付向量都直接繼承自原博弈122LLSSLSx1x23333（2）子博弈保留了原博弈的所有結(jié)構(gòu)：子博弈的信息集和支付向量進入不進入ABB進入不進入不進入進入收益：AB-3，-31，00，10，0抵賴坦白ABB抵賴坦白坦白抵賴-1，-1-9，00，-9-6，-6在市場進入博弈中，包含3個子博弈（包括原博弈）。而在囚徒博弈中，只有一個子博弈（？）進入不進入ABB進入不進入不進入進入收益：-3，-31，二、子博弈精煉納什均衡子博弈精煉納什均衡定義：在博弈G中，如果s*=(s1,…,sn)是G的一個納什均衡，并且對所有可能的子博弈而言仍是一個納什均衡，則稱s*=(s1,…,sn)為一個子博弈精煉納什均衡二、子博弈精煉納什均衡子博弈精煉納什均衡定義：市場進入博弈的納什均衡進入不進入ABB進入不進入不進入進入收益：AB-3，-31，00，10，0-3，-3-3，-31，01，00，10，00，10，0AB（進入，進入）進入不進入（進入，不進入）（不進入，進入）（不進入，不進入）該博弈中有三個納什均衡：不進入，（進入，進入）進入，（不進入，進入）進入，（不進入，不進入）前兩個均衡的結(jié)果(進入，不進入)，即A進入，B不進入；第二個均衡結(jié)果是(不進入，進入)，即A不進入，B進入如果理論得到這樣的結(jié)果，無助于預(yù)測博弈參與人的行為。此外，納什均衡假定，每一個參與人選擇的最優(yōu)戰(zhàn)略是在所有其他參與人的戰(zhàn)略選擇給定時的最優(yōu)反應(yīng)，即參與人并不考慮自己的選擇對其他人選擇的影響，因而納什均衡很難說是動態(tài)博弈的合理解。市場進入博弈的納什均衡進入不進入ABB進入不進入不進入進入收必須在多個納什均衡中剔除不合理的均衡解，即所謂“不可置信威脅”。子博弈精煉納什均衡是對納什均衡概念的最重要的改進。它的目的是把動態(tài)博弈中的“合理納什均衡”與“不合理納什均衡”分開。正如納什均衡是完全信息靜態(tài)博弈解的基本慨念一樣，子博弈精煉納什均衡是完全信息動態(tài)博弈解的基本概念。①{不進入，（進入，進入）}②{進入，（不進入，進入）}③{進入，（不進入，不進入）}進入不進入ABB進入不進入不進入進入收益：AB-3，-31，00，10，0前邊得到的三個納什均衡中，均衡①意味著當(dāng)A不進入時，B選擇進入；而當(dāng)A選擇進入時，B仍選擇進入（B威脅無論如何都要進入市場）。顯然，當(dāng)A選擇進入時，B仍選擇進入是不合理的，如果A進入市場，B選擇“不進入”比選擇“進入”收益要更大，理性的B不會選擇進入，而A知道B是理性的，因此也不會把該戰(zhàn)略視為B會選擇的戰(zhàn)略。因此，B的戰(zhàn)略（進入，進入）是不可置信威脅。必須在多個納什均衡中剔除不合理的均衡解，即所謂“不可置信威脅均衡③意味著當(dāng)A進入時，B選擇不進入；而當(dāng)A選擇不進入時，B仍選擇進入（B威脅無論如何都不進入市場）。顯然，當(dāng)A選擇不進入時，B仍選擇不進入是不合理的，B的戰(zhàn)略是不可置信的。

①{不進入，（進入，進入）}②{進入，（不進入，進入）}③{進入，（不進入，不進入）}只有均衡②是合理的：如果A進入，B不進入；如果A不進入，B進入。因為A是先行動者，理性的A會選擇“進入”（他知道B是理性的，B不會選擇“進入”），而理性的B選擇“不進入”。觀察博弈樹上的三個均衡中，B的不可置信戰(zhàn)略中的反應(yīng)，在第二階段B開始行動的兩個子博弈中不是最優(yōu)；而合理的納什均衡中，B的戰(zhàn)略在所有子博弈中都是最優(yōu)的，與A的第一階段可能選擇的行動構(gòu)成該子博弈的納什均衡。進入不進入ABB進入不進入不進入進入收益：AB-3，-31，00，10，0①②③①②③均衡③意味著當(dāng)A進入時，B選擇不進入；而只有當(dāng)一個戰(zhàn)略規(guī)定的行動規(guī)則在所有可能的情況下都是最優(yōu)的時，它才是一個合理的、可置信的戰(zhàn)略。子博弈精煉納什均衡就是要剔除掉那些只在特定情況下是合理的而在其他情況下并不合理的行動規(guī)則。

子博弈精煉納什均衡：如果參與者的戰(zhàn)略在每一個子博弈中都構(gòu)成了納什均衡，則稱納什均衡是子博弈精練的(澤爾滕，1965)。為簡單起見，假定博弈有兩個階段，第一階段參與人1行動，第2階段參與人2行動，并且2在行動前觀測到1的選擇。令A(yù)1是參與人1的行動空間，A2是參與人2的行動空間。當(dāng)博弈進入第二階段，給定參與人1在第一階段的選擇為a1∈A1，參與人2面臨的問題是：顯然參與人2的最優(yōu)選擇a2*依賴于參與人1的選擇a1。用a2*＝R(a1)代表上述最優(yōu)化問題的解(即2的反應(yīng)函數(shù))。因為參與人1應(yīng)該預(yù)測到參與人2在博弈的第二階段將按a2*＝R(a1)的規(guī)則行動，參與人1在第一階段面臨的問題是：只有當(dāng)一個戰(zhàn)略規(guī)定的行動規(guī)則在所有可能的情況令上述問題的最優(yōu)解為a1*。那么，這個博弈的子博弈精煉納什均衡為{a1*,R2(a1)}，均衡結(jié)果為{a1*,R2(a1*)}。(a1*,R2(a1*))是一個精煉均衡，因為a2*＝R2(a1)在博弈的第二階段是最優(yōu)的。除a2*＝R2(a1)之外，任何其他的行為規(guī)則都不滿足精練均衡的要求。上述思路就是逆向歸納法尋找子博弈精煉納是均衡的基本思路。令上述問題的最優(yōu)解為a1*。那么，這個博弈的甲乙（2，2）（1，0）（3，1）上下左右乙（2，1）左右乙{左，左}{左，右}{右，左}{右，右}2，22，22，12，11，03，11，03，1

上下甲甲乙（2，2）（1，0）（3，1）上下左右乙（2，1）左右納什均衡子博弈精煉納什均衡三個納什均衡：（上，{左，左}）（下，{左，右}）（下，{右，右}）排除（上，{左，左}），（下，{右，右}），只有（下{左，右}）是子博弈精煉納什均衡納什均衡子博弈精煉納什均衡三個納什均衡：三、求解方法：逆推法

逆向歸納法求解子博弈精煉納什均衡的過程，實質(zhì)是重復(fù)剔除劣戰(zhàn)略過程在擴展式博弈上的擴展：從最后一個決策結(jié)開始依次剔除掉每個子博弈的劣戰(zhàn)略，最后生存下來的戰(zhàn)略構(gòu)成精煉納什均衡。如同重復(fù)剔除的占優(yōu)均衡要求“所有參與人是理性的”是共同知識一樣，用逆向歸納法求解均衡也要求“所行參與人是理性的”是共同知識。三、求解方法：逆推法逆向歸納法求解子博122軟軟脆脆軟脆（0，0）（10，20）（20，10）（0，0）逆推法：例1122軟軟脆脆軟脆（0，0）（10，20）（20，10）（0甲丙乙上東下西左右（4，2，3）（1，7，8）（5，3，4）（7，6，6）丙丙（2，1，9）（0，4，2）逆推法：例2甲丙乙上東下西左右（4，2，3）（1，7，8）（5，3，4）進入者在位者（0，300）（40，50）（-10，0）不進入進入默許斗爭0，3000，300不進入-10，040，50進入斗爭默許進入者在位者支付逆推法：例3進入者在位者（0，300）（40，50）（-10，0）不進入四、承諾行動（commitment）與

子博弈精煉納什均衡納什均衡之所以不是精煉均衡，是因為不可置信的威脅存在，如父母與子女之間的博弈。如果參與人在博弈前采取措施改變行動空間或支付函數(shù)，原來不可置信威脅就變得可置信，博弈的精煉均衡就會改變；將改變博弈結(jié)果而采取的措施稱為“承諾行動”完全承諾，如破釜沉舟、軍事博弈不完全承諾，增加行動成本四、承諾行動（commitment）與

子博弈精煉納什均衡納承諾行動與博弈結(jié)果春節(jié)前夕，某小鎮(zhèn)上兩個商鋪主甲和乙同時看到一個賺錢機會：去城里販一批鞭炮回來零售，購貨款加上運輸費用共5000元，如果沒有競爭對手，這批貨在小鎮(zhèn)上能賣6000元；但如果另一家商鋪同時在小鎮(zhèn)上賣鞭炮，價格下跌使得這批鞭炮只能賣4000元。納什均衡是什么？假設(shè)甲先行動，商鋪乙看到對方的選擇后再決定是否進貨，子博弈精煉納什均衡是什么？承諾行動與博弈結(jié)果春節(jié)前夕，某小鎮(zhèn)上兩個商鋪主甲和乙同時看到承諾行動與博弈結(jié)果

如果甲先行動，但在博弈開始前商鋪主乙有一次行動A的機會，利用子博弈精煉均衡概念分析下述兩種情況下的博弈結(jié)果：（1）A：商鋪主乙逢人便說自己一定要進貨，無論對方如何行動他都不會改變這個決定；（2）A：商鋪主乙與某個嘲笑他說大話的第三者丙打賭：如果自己到時不進貨，向丙支付1500元；如果自己到時候進貨，丙向他支付100元。并且，乙將這個賭局通知甲。承諾行動與博弈結(jié)果如果甲先行動，但在博弈開始前商鋪主乙甲乙乙進進不進不進進不進（-1000，-1000）（1000，0）（0，1000）（0，0）甲乙乙進進不進不進進不進（-1000，-900）（1000，-1500）（0，1100）（0，-1500）甲乙乙進進不進不進進不進（-1000，-1000）（1000開金礦博弈的基本問題：甲在開采一價值4萬元的金礦時缺1萬元資金，而乙正好有1萬元資金可以投資。設(shè)甲想說服乙將這1萬元資金借給自己用于開礦，并許諾在采到金子后與乙對半分成，乙是否該將錢借給甲呢？

假設(shè)金礦的價值是經(jīng)過權(quán)威部門探測確認(rèn)的，沒必要懷疑。乙甲（0，4）（2，2）（1，0）不借借分不分開金礦博弈開金礦博弈的基本問題：甲在開采一價值4萬元的金礦時缺1萬元資不借乙甲乙借不分分（1，0）不打打（0，4）（1，0）（2，2）有法律保障的開金礦博弈——分錢打官司都可信在一個重視自身利益的成員組成的社會中，完善公正的法律制度不但能保障社會的公平，而且還能提高社會經(jīng)濟活動效率，是實現(xiàn)最有效率的社會分工合作的重要保障不借乙甲乙借不分分（1，0）不打打（0，4）（1，0）（2，乙甲乙打（2，2）不分分不借借（0，4）（-1，0）不打（1，0）法律保障不足的開金礦博弈——分錢打官司都不可信由于法制建設(shè)不完善，司法機構(gòu)執(zhí)法能力存在問題，并且也存在司法腐敗和“執(zhí)行難”的問題，因此，有理不一定能打贏官司，贏了官司卻反而輸了錢的事情在一些國家普遍存在乙甲乙打（2，2）不分分不借借（0，4）（-1，0）不打（1第三節(jié)子博弈精煉納什均衡舉例斯塔克爾伯格（Stackelberg）寡頭競爭模型勞資（工會與廠商）博弈模型羅賓斯泰英（Rubinstein）輪流出價的討價還價模型委托人—代理人理論第三節(jié)子博弈精煉納什均衡舉例斯塔克爾伯格（Stackelb一、斯塔克爾伯格模型產(chǎn)量領(lǐng)導(dǎo)模型：行動順序為，第一家廠商首先選擇產(chǎn)量；第二家廠商再選擇產(chǎn)量，得到反應(yīng)函數(shù)；將反應(yīng)函數(shù)代入第一家廠商的利潤函數(shù)求出y1*；然后求y2。追隨者max2=p(y1+y2)y2-c(y2)，得到反應(yīng)函數(shù)y2=f2(y1)領(lǐng)導(dǎo)者max1=p(y1+y2)y1-c(y1)=p(y1+f2(y1))y1-c(y1)，可以求出均衡產(chǎn)量y1*，跟隨者依照反應(yīng)函數(shù)求出y2*，進一步解出p。一、斯塔克爾伯格模型產(chǎn)量領(lǐng)導(dǎo)模型：行動順序為，第一家廠商首先斯塔克爾伯格模型求解設(shè)p=1-(y1+y2)，MC=0，則廠商2根據(jù)利潤最大化得到反應(yīng)函數(shù)y2=f2(y1)=(1-y1)/2，代入廠商1的利潤函數(shù)1=p(y1+y2)y1-c1(y1)，一階條件得到y(tǒng)1=1/2，代入廠商2的反應(yīng)函數(shù)得到y(tǒng)2=1/4，（1/2，1/4）為均衡解，（1/8，1/16）為其相應(yīng)的支付。斯塔克爾伯格模型求解設(shè)p=1-(y1+y2)，MC=0，斯塔克爾伯格模型y1y2f1(y2)f2(y1)1/21/4斯塔克爾伯格模型y1y2f1(y2)f2(y1)1/21/4二、勞資博弈模型里昂惕夫1946年提出，分別代表勞資雙方的工會與廠商之間的博弈模型。該模型假設(shè)工資完全由工會決定，而廠商則根據(jù)工會要求的工資高低決定雇用工人的數(shù)量。工會代表的勞方效用u=u(W,L)。廠商的利潤函數(shù)為=(W,L)=R(L)-WL。行動順序為：先由工會決定工資率，然后廠商根據(jù)工會提出的工資率決定雇用多少勞動。二、勞資博弈模型里昂惕夫1946年提出，分別代表勞資雙方的工勞資博弈模型采用逆推法求解先分析第二階段廠商的選擇。廠商對工會選擇的工資率W的反應(yīng)函數(shù)為L=L(W)，則：max(W,L)=max[R(L)-WL],解得R’(L)=W，求得L*(W)為在給定工會選擇W時廠商的最優(yōu)雇傭數(shù)量。然后分析第一階段工會的選擇。工會清楚廠商對應(yīng)每一個W所選擇的L*，工會需要決定的是選擇W*，使得maxu=u(W,L*(W)),求得符合工會最大利益的W*。勞資博弈模型采用逆推法求解勞資博弈模型先由工會決定工資率，再由廠商決定雇用多少勞動力RL0WL廠商的反應(yīng)函數(shù)R(L)斜率為WLW0工會的無差異曲線勞資博弈模型先由工會決定工資率，再由廠商決定雇用多少勞動力R三、羅賓斯泰林討價還價模型討價還價模型簡述：甲、乙兩人協(xié)商分配上級下?lián)艿?000元錢。在給定的3天協(xié)商時間內(nèi)，第一天甲提出一個分配方案，乙若同意的話就按此分配，乙若不同意他可在第二天提出自己的方案，甲可選擇接受或在第三天再提出一個方案，乙對此可以接受或拒絕；如果3天內(nèi)兩人不能達成協(xié)議，上級將收回這1000元錢；甲和乙分別按天貼現(xiàn)率和貼現(xiàn)自己的未來收益，0、1。簡化條件：如果自己不能從拒絕對方提案中獲取更多的收益，局中人都會接受對方提案。三、羅賓斯泰林討價還價模型討價還價模型簡述：Rubinstein討價還價模型第一天第二天第三天甲乙提案拒絕并提案甲拒絕并提案乙拒絕（a3,b3）(a2,b2)(a1,b1)接受接受接受（0，0）Rubinstein討價還價模型第一天第二天第三天甲乙提案拒Rubinstein討價還價模型解析:逆推法第三天：只要甲的提案滿足b10，乙總會接受，甲的目標(biāo)是利益最大化，因而提案為(a1,b1)=(1,0)（單位為千元）第二天：乙預(yù)料到第三天(1,0)的結(jié)果，所以盡可能讓甲接受自己的提案，提案中給甲的金額不小于1的貼現(xiàn)，因而有方案(a2,b2)=(,1-)第一天：甲清楚如果自己的提案被否決，對方第二天的提案將是(,1-)，自己會接受它。甲的問題是保證第一天乙得到(1-)的前提下自己盡可能多得一些。他的最佳選擇將是(a3,b3)=(1-(1-),(1-))，乙接受，博弈于第一天即告結(jié)束Rubinstein討價還價模型解析:逆推法第三天：只要甲的無窮次討價還價模型無窮次討價還價模型不能采用逆推法Rubinstein曾經(jīng)對其進行證明，得到結(jié)果：甲在第一階段提出((1-)/(1-),1-(1-)/(1-))，乙接受無窮次討價還價模型無窮次討價還價模型不能采用逆推法四、委托人—代理人理論委托人——代理人關(guān)系經(jīng)濟活動和社會活動中有很多委托人——代理人關(guān)系，有明顯的，也有隱蔽的。工廠和工人、店主和店員、客戶和律師、市民和政府、基金購買者和基金管理人等都是。委托人——代理人關(guān)系的關(guān)鍵特征：不能直接控制，監(jiān)督不完全，信息不完全，利益的相關(guān)性委托人——代理人涉及問題：激勵機制設(shè)計、機制設(shè)計理論，委托合同設(shè)計問題等四、委托人—代理人理論委托人——代理人關(guān)系無不確定性的委托人—代理人模型[R(E)-w(E),w(E)-E][R(S)-w(S),w(S)-S][R(0),0][R(0),0]122偷懶努力拒絕接受不委托委托代理人的選擇激勵相容約束：w(E)-E>w(S)-Sw(E)>w(S)+E-S無不確定性的委托人—代理人模型[R(E)-w(E),w(E參與約束：22[R(E)-w(E),w(E)-E]拒絕接受拒絕接受[R(0),0][R(S)-w(S),w(S)-S][R(0),0]接受：w(E)-E>0接受：w(S)-S>0參與約束參與約束：22[R(E)-w(E),w(E)-E]拒絕接受

委托人的選擇11不委托委托委托[R(S)-w(S),w(S)-S][R(0),0][R(E)-w(E),w(E)-E]不委托[R(0),0]委托：R(E)-w(E)

>R(0)不委托：R(E)-w(E)

<R(0)委托：R(S)-w(S)

>R(0)不委托：R(S)-w(S)<R(0)委托人的選擇11不委托委托委托[R(S)-w(S數(shù)值例子[12,2][0,0][0,0]122偷懶努力拒絕接受不委托委托[7，1]E=2,S=1,W(E)=4,w(S)=2數(shù)值例子[12,2][0,0][0,0]122偷懶努力拒絕有不確定性但可監(jiān)督的委托人—代理人博弈10022[0，0][0，0][10-w(S),w(S)-S][20-w(S),w(S)-S][10-w(E),w(E)-E][20-w(E),w(E)-E]不委托高產(chǎn)(0.1)低產(chǎn)(0.9)低產(chǎn)(0.1)高產(chǎn)(0.9)努力偷懶接受拒絕委托偷懶：委托：

0.1*[20-w(S)]+0.9*[10-w(S)]>0不委托：

0.1*[20-w(S)]+0.9*[10-w(S)]<0努力委托：0.9*[20-w(E)]+0.1*[10-w(E)]>0不委托：0.9*[20-w(E)]+0.1*[10-w(E)]<0因為可監(jiān)督，因此代理人報酬與成果無關(guān)，只與努力情況有關(guān)。不確定性風(fēng)險由委托人承擔(dān)。代理人選擇同無不確定性情況。有不確定性但可監(jiān)督的委托人—代理人博弈10022[0，0][有不確定性且不可監(jiān)督的委托人—代理人博弈122[0，0][0，0][10-w(10),w(10)-S][20-w(20),w(20)-S][10-w(10),w(10)-E][20-w(20),w(20)-E]不委托高產(chǎn)(0.1)低產(chǎn)(0.9)低產(chǎn)(0.1)高產(chǎn)(0.9)努力偷懶接受拒絕委托0只能根據(jù)成果付酬，w是成果函數(shù)，而非努力程度函數(shù)。不確定性對代理人利益、選擇有影響。有不確定性且不可監(jiān)督的委托人—代理人博弈122[0，0][0努力：0.9*[w(20)-E]+0.1*[w(10)-E]>0.1*[w(20)-S]+0.9*[w(10-S)]接受：0.9*[w(20)-E]+0.1*[w(10)-E]>0委托：0.9*[20-w(20)]+0.1*[10-w(10)]>0激勵相容約束促使代理人努力的激勵相容約束、參與約束，以及委托人選擇委托的條件參與約束對于委托人來說，就是要根據(jù)上述兩個條件，以及E、S的值，選擇最佳的工資水平w(20)和w(10)，或者它們的差額w(20)-w(10)努力：接受：委托：激勵相容約束促使代理人努力的激勵相容約束、第四節(jié)

重復(fù)博弈和無名氏定理有限次重復(fù)博弈：連鎖店悖論無限次重復(fù)博弈和無名氏定理第四節(jié)

重復(fù)博弈和無名氏定理有限次重復(fù)博弈：連鎖店悖論一、有限次重復(fù)博弈有限次重復(fù)博弈令G為階段性博弈，G(T)是G重復(fù)T次的重復(fù)博弈（T<）。如果G有唯一的納什均衡解，重復(fù)博弈G(T)的唯一子博弈精煉納什均衡結(jié)果是階段博弈G的納什均衡重復(fù)T次，如囚犯困境。一、有限次重復(fù)博弈有限次重復(fù)博弈有限次重復(fù)博弈：連鎖店悖論連鎖店悖論假定同樣的市場有20個（可以理解為在位者有20個連鎖店），進入者每次進入一個市場，博弈就變成了20次重復(fù)博弈。子博弈精煉納什均衡為，在位者在每一個市場選擇默許，進入者在每一個市場選擇進入。有限次重復(fù)博弈：連鎖店悖論連鎖店悖論連鎖店悖論—市場進入博弈默許斗爭進入40，50-10，0不進入0，3000，300進入者支付在位者連鎖店悖論—市場進入博弈默許斗爭進入40，50-10，0不進3，30，4利他4，01，1利己利他利己甲乙支付n次重復(fù)博弈3，30，4利他4，01，1利己利他利己甲乙支付n次重復(fù)討論“信息完備”是重復(fù)博弈的一個必要條件，事實證明，如果局中人的博弈環(huán)境存在不完備信息，或者存在不確定性，類似于“連鎖店悖論”這樣的問題多半會消失。假定連鎖店有高成本、低成本兩種情況，就但其博弈看，面對新廠商進入，高成本廠商最佳反應(yīng)為容忍，低成本廠商最佳反應(yīng)為斗爭，那么高成本廠商在博弈的前期階段選擇斗爭，仍是可信的威脅。討論“信息完備”是重復(fù)博弈的一個必要條件，事實證明，如果局中二、無限次重復(fù)博弈與無名氏定理無限次重復(fù)博弈假設(shè)囚徒困境是一個階段性博弈，并且是無限次重復(fù)博弈，那么任一個囚徒選擇抵賴的條件是：0+(-6)+2(-6)+…-1+(-1)+2(-1)+…（為貼現(xiàn)因子）或者-6/(1-)-1/(1-)，即1/6（即局中人具有足夠的耐心），（抵賴、抵賴）是無限次囚徒博弈的一個子博弈精煉納什均衡。二、無限次重復(fù)博弈與無名氏定理無限次重復(fù)博弈冷酷戰(zhàn)略（grimstrategies）也稱觸發(fā)戰(zhàn)略（triggerstratigies）以囚徒困境為例：開始選擇抵賴，選擇抵賴直到有一方選擇了坦白，然后永遠(yuǎn)選擇坦白。一旦哪個參與人選擇了坦白，就觸發(fā)了懲罰的扳機。。冷酷戰(zhàn)略（grimstrategies）也稱觸發(fā)戰(zhàn)略（tr無名氏定理在無限次重復(fù)博弈中，如果參與人具有足夠的耐心（即足夠大），那么任何滿足個人理性的可行的支付向量都可以通過一個特定的子博弈精煉均衡得到。無名氏定理在無限次重復(fù)博弈中，如果參與人具有足夠的耐心（無名氏定理舉例以“利己、利他”為例，其博弈中唯一的納什均衡為（利己，利己），兩個局中人在此均衡下所的支付都是1；所以，只要無窮重復(fù)博弈中局中人可行的平均單期支付不小于1，這樣的支付就是一個可能的均衡支付。無窮重復(fù)博弈能夠?qū)е屡晾淄懈倪M。無名氏定理舉例以“利己、利他”為例，其博弈中唯一的納什均衡為寡頭市場上古諾均衡的

無限次重復(fù)博弈合作：生產(chǎn)壟斷產(chǎn)量的一半(1/4,1/4)，獲取超額利潤(1/8,1/8)不合作：生產(chǎn)納什均衡產(chǎn)量(1/3,1/3)，獲取超額利潤(1/9,1/9)給定企業(yè)堅持冷酷戰(zhàn)略，企業(yè)一開始生產(chǎn)1/4，中途只要有企業(yè)偏離合作產(chǎn)量，生產(chǎn)短期最優(yōu)產(chǎn)量3/8，則對方選擇1/3。寡頭市場上古諾均衡的

無限次重復(fù)博弈合作：生產(chǎn)壟斷產(chǎn)量的一半證明冷酷戰(zhàn)略是子博弈精煉納什均衡如果下列條件滿足，則任一企業(yè)沒有積極性偏離合作均衡：9/64+/9+2/9+…1/8+/8+2/8+…即如果9/17，默契合作就會是一個精煉均衡結(jié)果。寡頭市場上古諾均衡的

無限次重復(fù)博弈證明冷酷戰(zhàn)略是子博弈精煉納什均衡寡頭市場上古諾均衡的

無限次如果有n個寡頭企業(yè)，默契合作要求(1+4n/(n+1)2)-1，當(dāng)n時,1，即企業(yè)越多，默契合作越困難。解釋了為什么小團體的合作靠非正式規(guī)則就可以維持，而大團體就必須依賴于正式的規(guī)則與合約。寡頭市場上古諾均衡的

無限次重復(fù)博弈如果有n個寡頭企業(yè)，默契合作要求(1+4n/(n+1)2作業(yè)1：請找出此博弈的子博弈精煉納什均衡（-6，-6）EIE進L不進SLS（-3，-3）（-1，1）（1，-1）ELS（0，2）作業(yè)1：請找出此博弈的子博弈精煉納什均衡（-6，-6）EIE作業(yè)2一個建筑公司每到有工程合同才雇用臨時工人。考慮某項工程中公司與工人的勞動-工資博弈；工人受雇于該公司的機會成本是0；工人可以老實地干活，為公司創(chuàng)造利潤y，但這需要付出勞動成本l，y>l>0；工人也可以受雇后不干活，這不需任何勞動成本，同時創(chuàng)造的利潤也是0。假設(shè)公司與工人在工程結(jié)束之前沒有任何工資合同，它只是在雇用期滿后才決定付給每個工人的工資額w。作業(yè)2一個建筑公司每到有工程合同才雇用臨時工人?？紤]某項工程作業(yè)2如果該建筑公司在未來的10年內(nèi)每年有一項相同的工程，證明：無論公司的利潤貼現(xiàn)因子是多少，唯一的子博弈完美均衡是：在每一項工程中，無論工人是否干活，公司向工人付的工資額w都是0；工人不干活。如果該建筑公司依次有無窮多個工程，而下一期工人又能看到以前的工資政策。證明：只要充分接近1，每一期工人都努力干獲將是一個子博弈完美均衡戰(zhàn)略。在所有子博弈完美均衡中，對公司最有利的是什么樣的均衡？作業(yè)2如果該建筑公司在未來的10年內(nèi)每年有一項相同的工程，證完全信息動態(tài)博弈(博弈論與信息經(jīng)濟學(xué))課件第二章完全信息動態(tài)博弈博弈的擴展式表述子博弈精煉納什均衡子博弈精煉納什均衡舉例重復(fù)博弈和無名氏定理第二章完全信息動態(tài)博弈博弈的擴展式表述第一節(jié)博弈的擴展式表述第一節(jié)博弈的擴展式表述完全信息動態(tài)博弈一般以擴展型式來表示：G=(N,H,P,I,U)，包括5要素：（1）局中人N；（2）歷史H:博弈樹是一個多環(huán)節(jié)與枝干的集合，從單一的起始環(huán)節(jié)，直到終結(jié)環(huán)節(jié)，代表博弈歷史；（3）對每個環(huán)節(jié)的分配法則P:將每個環(huán)節(jié)（除終結(jié)環(huán)節(jié)外）分配給不同的局中人，并賦予行動時可選的策略；（4）局中人行動時的信息集合I；（5）對應(yīng)局中人可能選擇策略，各局中人在終結(jié)環(huán)節(jié)所得到的報酬U。完全信息動態(tài)博弈一般以擴展型式來表示：G=(N,H,P,I,122LLSSLS（2，2）（-1，-1）（-1，-1）（1，1）戰(zhàn)略式表述(strategicformrepresentation)多用矩陣2,2-1,-1-1,-11,12LSLS1擴展式表述(extensiveformrepresentation)多用博弈樹戰(zhàn)略式與擴展式122LLSSLS（2，2）（-1，-1）（-1，-1）（1-3，-3-3，-31，01，00，10，00，10，0AB（進入，進入）進入不進入（進入，不進入）（不進入，進入）（不進入，不進入）市場進入博弈的標(biāo)準(zhǔn)式進入不進入ABB進入不進入不進入進入收益：AB-3，-31，00，10，0市場進入的擴展式-3，-3-3，-31，01，00，10，00在市場進入博弈中：A有兩個行動：“進入”、“不進入”。由于是先行動者，只有兩個戰(zhàn)略：選擇“進入”或“不進入”。

B有兩個行動：“進入”、“不進入”。但是，有4個戰(zhàn)略：(1)若A選擇“進入”，B選擇“進入”，若A選擇“不進入”，B選擇“進入”，即

（進入，進入）(2)若A選擇“進入”，B選擇“進入”，若A選擇“不進入”，B選擇“不進入”，即

子博弈精煉納什均衡子博弈子博弈精煉納什均衡求解方法：逆向歸納法承諾行動與子博弈精煉納什均衡第二節(jié)

委托人的選擇11不委托委托委托[R(S)-w(S),w(S)-S][R(0),0][R(E)-w(E),w(E)-E]不委托[R(0),0]委托：R(E)-w(E)

>R(0)不委托：R(E)-w(E)

<R(0)委托：R(S)-w(S)

0.1*[20-w(S)]+0.9*[10-w(S)]>0不委托：

人人文庫> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

完全信息動態(tài)博弈(博弈論與信息經(jīng)濟學(xué))課件

文檔簡介

溫馨提示

最新文檔

評論

完全信息動態(tài)博弈(博弈論與信息經(jīng)濟學(xué))課件

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔