版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第一章:完全信息靜態(tài)博弈本章內(nèi)容:博弈論的基本概念及戰(zhàn)略式表述納什均衡納什均衡應(yīng)用舉例混合戰(zhàn)略納什均衡納什均衡的存在性與多重性11/24/2022博弈論(陳艷)第一章:完全信息靜態(tài)博弈本章內(nèi)容:10/22/2022博弈論1第一節(jié)博弈論的基本概念
與戰(zhàn)略式表述博弈論的基本概念戰(zhàn)略式表述11/24/2022博弈論(陳艷)第一節(jié)博弈論的基本概念
與戰(zhàn)略式表述博弈論的基本概念10/21.1-1基本概念1、參與人:一個(gè)博弈中的決策主體,其目的是通過選擇行動(dòng)(或戰(zhàn)略)以最大化自己的支付(效用)水平。“自然”作為虛擬參與人來處理。是指決定外生的隨機(jī)變量的概率分布的機(jī)制。i=1,…,n代表參與人,N代表自然11/24/2022博弈論(陳艷)1.1-1基本概念1、參與人:一個(gè)博弈中的決策主體,其目的是32、行動(dòng):行動(dòng)是指參與人在博弈的某個(gè)時(shí)點(diǎn)的決策變量。用ai表示第i個(gè)參與人的一個(gè)特定行動(dòng),Ai={ai}表示可供i選擇的所有行動(dòng)的集合。3、信息:是參與人有關(guān)博弈的知識(shí),特別是有關(guān)“自然”的選擇、其他參與人的特征和行動(dòng)的知識(shí)。信息集完美信息:一個(gè)參與人對(duì)其他參與人(包括虛擬參與人“自然”)的行動(dòng)選擇有準(zhǔn)確了解的情況,即每個(gè)信息集只包含一個(gè)值完全信息:自然不首先行動(dòng)或自然的初始行動(dòng)被所有參與人準(zhǔn)確觀察到的情況,即沒有事前的不確定性。共同知識(shí):所有參與人知道,所有參與人知道所有參與人知道,所有參與人知道所有參與人知道所有參與人知道…的知識(shí)。一致信念:即使所有參與人“共同”享有某種知識(shí),每個(gè)參與人也可能不知道其他參與人知道這些知識(shí),或者并不知道其他人知道自己擁有這些知識(shí)。11/24/2022博弈論(陳艷)2、行動(dòng):行動(dòng)是指參與人在博弈的某個(gè)時(shí)點(diǎn)的決策變量。用ai表44、戰(zhàn)略:是參與人在給點(diǎn)信息集的情況下的行動(dòng)規(guī)則,它規(guī)定參與人在什么時(shí)候選擇什么行動(dòng)。用si表示第i個(gè)參與人的一個(gè)特定戰(zhàn)略,Si={si}代表第i個(gè)參與人的所有可選擇的戰(zhàn)略集合。5、支付:在博弈論中,支付或者是指在一個(gè)特定的戰(zhàn)略組合下參與人得到的確定效用水平,或者是指參與人得到的期望效用水平。令ui為第i個(gè)參與人的支付(效用水平),u=(u1,…,ui,…,un)為n個(gè)參與人的支付組合。于是ui=ui(s1,…,si,…,sn),即ui是所有參與人的戰(zhàn)略選擇的函數(shù)。11/24/2022博弈論(陳艷)4、戰(zhàn)略:是參與人在給點(diǎn)信息集的情況下的行動(dòng)規(guī)則,它規(guī)定參與56、結(jié)果:是博弈分析者所感興趣的所有東西,如均衡戰(zhàn)略組合、均衡行動(dòng)組合、均衡支付組合等。7、均衡:是所有參與人的最優(yōu)戰(zhàn)略的組合,一般記為:s*=(s1*,…,si*,…,sn*)。為了把一個(gè)特定參與人與其他參與人相區(qū)別,我們將用s-i=(s1,…,si-1,si+1,…,sn)表示由除i之外的所有參與人的戰(zhàn)略組成的向量。博弈論(gametheory)是研究決策主體的行為發(fā)生直接相互作用時(shí)候的決策以及這種決策的均衡問題。11/24/2022博弈論(陳艷)6、結(jié)果:是博弈分析者所感興趣的所有東西,如均衡戰(zhàn)略組合、均61.1-2博弈論的戰(zhàn)略式表達(dá)一個(gè)博弈可以用兩種不同的方式來表述,一種是戰(zhàn)略式表述,另一種是擴(kuò)展式表述。盡管從理論上講,這兩種表述形式幾乎是完全等價(jià)的,但從分析的方便性的角度看,戰(zhàn)略式表述更適合于靜態(tài)博弈,而擴(kuò)展式表述更適合于討論動(dòng)態(tài)博弈。博弈的戰(zhàn)略式表述:G={N,(Si)iN,(Ui)iN}有三個(gè)基本要素:(1)參與人(players)iN={1,2,…,n};(2)戰(zhàn)略(strategies),siSi(戰(zhàn)略空間);(3)支付(payoffs),ui=ui(s-i,si)。11/24/2022博弈論(陳艷)1.1-2博弈論的戰(zhàn)略式表達(dá)一個(gè)博弈可以用兩種不同的方式來表7案例1:囚犯困境抵賴坦白抵賴-1,-1-9,0坦白0,-9-6,-6支付嫌疑人B嫌疑人A11/24/2022博弈論(陳艷)案例1:囚犯困境支付嫌疑人B嫌疑人A10/22/2022博8均衡與均衡結(jié)果均衡戰(zhàn)略(坦白,坦白)均衡支付(-6,-6)11/24/2022博弈論(陳艷)均衡與均衡結(jié)果均衡戰(zhàn)略(坦白,坦白)10/22/2022博弈9第二節(jié)納什均衡占優(yōu)戰(zhàn)略均衡重復(fù)剔除的占優(yōu)戰(zhàn)略均衡納什均衡11/24/2022博弈論(陳艷)第二節(jié)納什均衡占優(yōu)戰(zhàn)略均衡10/22/2022博弈論(陳艷101.2-1完全信息靜態(tài)博弈的幾點(diǎn)特性1、每個(gè)參與人對(duì)所有其他參與人的特征(包括戰(zhàn)略空間、支付函數(shù)等)有完全的了解,即知道博弈結(jié)構(gòu)與游戲規(guī)則(共同知識(shí))但不知道其他人的行動(dòng)。2、所有參與人同時(shí)選擇行動(dòng)且只行動(dòng)一次。同時(shí)行動(dòng),是一個(gè)信息概念而非時(shí)間概念:只要每個(gè)參與人在選擇自己的行動(dòng)時(shí)不知道其他參與人的選擇,我們就說他們?cè)谕瑫r(shí)行動(dòng)。3、不管是否溝通過,無法做出有約束力的承諾(非合作)11/24/2022博弈論(陳艷)1.2-1完全信息靜態(tài)博弈的幾點(diǎn)特性1、每個(gè)參與人對(duì)所有其他111.2-1占優(yōu)戰(zhàn)略均衡占優(yōu)戰(zhàn)略:不管對(duì)手戰(zhàn)略為何,該參與人可找到一最佳戰(zhàn)略。一般地,si*稱為參與人i的(嚴(yán)格)占優(yōu)戰(zhàn)略。定義:在博弈G={N,(Si)iN,(Ui)iN}中,如果對(duì)所有的參與人i,si*是它的占優(yōu)戰(zhàn)略,那么所有參與人選擇的戰(zhàn)略組合(s1*,…,sn*)成為該對(duì)策的占優(yōu)戰(zhàn)略均衡。11/24/2022博弈論(陳艷)1.2-1占優(yōu)戰(zhàn)略均衡占優(yōu)戰(zhàn)略:不管對(duì)手戰(zhàn)略為何,該參與人可12案例1:囚犯困境抵賴坦白抵賴-1,-1-9,0坦白0,-9-6,-6支付嫌疑人B嫌疑人A11/24/2022博弈論(陳艷)案例1:囚犯困境支付嫌疑人B嫌疑人A10/22/2022博13囚犯困境的擴(kuò)展應(yīng)該指出,占優(yōu)戰(zhàn)略均衡只要求每個(gè)參與人是理性的,而并不要求每個(gè)參與人知道其他參與人是理性的從“納什均衡”引出“看不見的手”的一個(gè)悖論:從利己目的出發(fā),結(jié)果損人不利己?!凹{什均衡”提出的悖論動(dòng)搖了經(jīng)濟(jì)學(xué)的基石。兩個(gè)寡頭企業(yè)選擇產(chǎn)量公共產(chǎn)品的供給軍備競賽經(jīng)濟(jì)改革結(jié)論:一種制度安排,要發(fā)生效力。必須是一種納什均衡;否則,制度安排便不能成立。11/24/2022博弈論(陳艷)囚犯困境的擴(kuò)展應(yīng)該指出,占優(yōu)戰(zhàn)略均衡只要求每個(gè)參與人是理性的14價(jià)格大戰(zhàn)低價(jià)高價(jià)低價(jià)3,36,1高價(jià)1,65,5百事可樂可口可樂支付11/24/2022博弈論(陳艷)價(jià)格大戰(zhàn)百事可樂可口可樂支付10/22/2022博弈論(陳艷151.2-2重復(fù)剔除的占優(yōu)戰(zhàn)略均衡絕對(duì)劣勢戰(zhàn)略:si是一絕對(duì)劣勢戰(zhàn)略當(dāng)且僅當(dāng)存在另一戰(zhàn)略si’Si使得ui(si,s-i)<ui(si’,s-i)對(duì)所有s-iS-i均成立。(si’未必是優(yōu)勢戰(zhàn)略)重復(fù)剔除的占優(yōu)戰(zhàn)略均衡:逐次刪去絕對(duì)劣勢戰(zhàn)略得到唯一的占優(yōu)戰(zhàn)略。首先找出某個(gè)參與人的劣戰(zhàn)略,剔除之,再找,再剔除,直到最后的一個(gè)11/24/2022博弈論(陳艷)1.2-2重復(fù)剔除的占優(yōu)戰(zhàn)略均衡絕對(duì)劣勢戰(zhàn)略:si是一絕對(duì)劣16案例2:智豬博弈豬圈里圈兩頭豬,一頭大豬,一頭小豬。豬圈的一頭有一個(gè)豬食槽,另一頭安裝一個(gè)按鈕,控制著豬食的供應(yīng)。按一下按鈕會(huì)有10個(gè)單位的豬食進(jìn)槽,但誰按按鈕誰就要付出2個(gè)單位的成本。若大豬先到,大豬吃到9個(gè)單位,小豬只能吃1個(gè)單位;若同時(shí)到,大豬吃7個(gè)單位,小豬吃3個(gè)單位;若小豬先到,大豬吃6個(gè)單位,小豬吃4個(gè)單位。支付如表。11/24/2022博弈論(陳艷)案例2:智豬博弈豬圈里圈兩頭豬,一頭大豬,一頭小豬。豬圈的一17案例2:智豬博弈0,09,-1等待4,45,1按等待按支付小豬大豬11/24/2022博弈論(陳艷)案例2:智豬博弈支付小豬大豬10/22/2022博弈論(陳18智豬博弈的擴(kuò)展股份公司承擔(dān)監(jiān)督經(jīng)理職能的大股東與小股東股票市場上炒股票的大戶與小戶市場中大企業(yè)與小企業(yè)在研發(fā)、廣告上的博弈公共產(chǎn)品的提供(富戶與窮戶)改革中不同利益分配對(duì)改革的推動(dòng)11/24/2022博弈論(陳艷)智豬博弈的擴(kuò)展股份公司承擔(dān)監(jiān)督經(jīng)理職能的大股東與小股東10/19例:重復(fù)剔除的占優(yōu)戰(zhàn)略均衡
首先剔除R1,01,20,10,30,12,0參與人2LMR參與人1UD11/24/2022博弈論(陳艷)例:重復(fù)剔除的占優(yōu)戰(zhàn)略均衡
首先剔除R20例:重復(fù)剔除的占優(yōu)戰(zhàn)略均衡
其次剔除D1,01,20,30,1參與人2LM參與人1UD11/24/2022博弈論(陳艷)例:重復(fù)剔除的占優(yōu)戰(zhàn)略均衡
其次剔除D參與人221例:重復(fù)剔除的占優(yōu)戰(zhàn)略均衡
最后剔除L1,01,2參與人2LM參與人1U最后均衡結(jié)果:(U,M)11/24/2022博弈論(陳艷)例:重復(fù)剔除的占優(yōu)戰(zhàn)略均衡
最后剔除L參與人222例重復(fù)剔除的占優(yōu)戰(zhàn)略均衡4,35,16,22,18,43,63,09,62,8參與人2LMR參與人1UDN11/24/2022博弈論(陳艷)例重復(fù)剔除的占優(yōu)戰(zhàn)略均衡23例重復(fù)剔除的占優(yōu)戰(zhàn)略均衡參與人2LMR參與人1UDN1,01,33,00,20,13,00,22,45,311/24/2022博弈論(陳艷)例重復(fù)剔除的占優(yōu)戰(zhàn)略均衡241.2-3納什均衡定義:指一戰(zhàn)略組合有以下特性:當(dāng)參與人持此戰(zhàn)略后,任一參與人均無誘因偏離這一均衡;s*=(s1*,…,sn*)=(si*,s-i*)是一納什均衡,當(dāng)且僅當(dāng)對(duì)所有參與人而言,ui(si*,s-i*)ui(si’,s-i*)對(duì)所有si’Si均成立。簡單而言,當(dāng)s1*是對(duì)s2*的最適反應(yīng),s2*也是s1*的最適反應(yīng)時(shí),(s1*,s2*)就是二人博弈的納什均衡。命題1:納什均衡在占優(yōu)戰(zhàn)略重復(fù)剔除解法中不會(huì)被剔除命題2:重復(fù)剔除的嚴(yán)格占優(yōu)戰(zhàn)略均衡一定是納什均衡。11/24/2022博弈論(陳艷)1.2-3納什均衡定義:指一戰(zhàn)略組合有以下特性:當(dāng)參與人持此25例納什均衡求解0,44,05,34,00,45,33,53,56,6參與人2LMR參與人1UDN11/24/2022博弈論(陳艷)例納什均衡求解參與人226三者之間的關(guān)系1、每一個(gè)占優(yōu)戰(zhàn)略均衡、重復(fù)剔除的占優(yōu)均衡一定是納什均衡,但并非每一個(gè)納什均衡都是占優(yōu)戰(zhàn)略均衡或重復(fù)剔除的占優(yōu)均衡。2、納什均衡一定是在重復(fù)剔除嚴(yán)格劣戰(zhàn)略過程中沒有被剔除掉的戰(zhàn)略組合,但沒有被剔除的戰(zhàn)略組合不一定是納什均衡,除非它是唯一的。11/24/2022博弈論(陳艷)三者之間的關(guān)系1、每一個(gè)占優(yōu)戰(zhàn)略均衡、重復(fù)剔除的占優(yōu)均衡一定27作業(yè)7,76,67,65,75,88,56,65,84,8乙左中右上中下甲一個(gè)兩人同時(shí)博弈的支付競爭如下所示,試求納什均衡。是否存在重復(fù)剔除占優(yōu)戰(zhàn)略均衡?11/24/2022博弈論(陳艷)作業(yè)7,76,67,65,75,88,56,65,84,828第三節(jié)納什均衡應(yīng)用舉例古諾(Cournot)寡頭模型沙灘賣冰豪泰林(Hotelling)價(jià)格競爭模型公共地的悲劇11/24/2022博弈論(陳艷)第三節(jié)納什均衡應(yīng)用舉例古諾(Cournot)寡頭模型10/291.3-1古諾寡頭模型特點(diǎn):存在兩家廠商;同時(shí)行動(dòng)確定產(chǎn)量。通過預(yù)測另一家廠商的產(chǎn)量來選擇自己的利潤最大化產(chǎn)量,尋求預(yù)測均衡。廠商1表示為:maxqiP(q1+q2)-ci(qi),得出q1=f1(q2),同理得出q2=f2(q1),稱為反應(yīng)函數(shù),兩條曲線的交點(diǎn)為古諾模型的解。11/24/2022博弈論(陳艷)1.3-1古諾寡頭模型特點(diǎn):存在兩家廠商;同時(shí)行動(dòng)確定產(chǎn)量。30古諾寡頭模型的納什均衡反應(yīng)函數(shù)q1=f1(q2)q2=f2(q1)(q1*,q2*)是該對(duì)策的納什均衡解。q1*q12q11
q10q2*q22q21q1oq2f1(q2)f2(q1)11/24/2022博弈論(陳艷)古諾寡頭模型的納什均衡反應(yīng)函數(shù)q1*q12q11q31例題:古諾模型的解假設(shè)p=a-(q1+q2),C1=q1c,C2=q2c則根據(jù)利潤最大化的一階條件分別得到反應(yīng)函數(shù)q1=f1(q2)=(a-q2-c)/2,q2=f2(q1)=(a-q1-c)/2,求出均衡產(chǎn)量為(1/3(a-c),1/3(a-c)),為納什均衡,均衡利潤為(1/9(a-c)2,1/9(a-c)2)11/24/2022博弈論(陳艷)例題:古諾模型的解假設(shè)p=a-(q1+q2),C1=q1c,32古諾模型的解:與壟斷市場的比較假設(shè)為一壟斷企業(yè),則有:Max=q(a-q-c),得到壟斷企業(yè)的最優(yōu)產(chǎn)量q=1/2(a-c)q1+q2=2/3(a-c)壟斷利潤為=1/4(a-c)22/9(a-c)2寡頭競爭的總產(chǎn)量大于壟斷產(chǎn)量的原因在于每個(gè)企業(yè)在選擇自己的最優(yōu)產(chǎn)量時(shí),只考慮對(duì)本企業(yè)利潤的影響,而忽視對(duì)另一個(gè)企業(yè)的外部負(fù)效應(yīng)。11/24/2022博弈論(陳艷)古諾模型的解:與壟斷市場的比較假設(shè)為一壟斷企業(yè),則有:10/33寡頭廠商與壟斷廠商的比較1/3(a-c)1/2(a-c)1/2(a-c)q1oq2f1(q2)f2(q1)1/3(a-c)11/24/2022博弈論(陳艷)寡頭廠商與壟斷廠商的比較1/3(a-c)1/2341.3-2沙灘賣冰假設(shè)游客沿沙灘{0,1}間均勻分布,現(xiàn)有兩位賣冰者,他們會(huì)將攤位選在哪個(gè)位置?假設(shè)游客就近購買。生活中還有哪些類似的例子?0???111/24/2022博弈論(陳艷)1.3-2沙灘賣冰假設(shè)游客沿沙灘{0,1}間均勻分布,現(xiàn)有351.3-3豪泰林模型寡頭企業(yè)競爭戰(zhàn)略是價(jià)格伯川德(Bertrand)模型:產(chǎn)品同質(zhì),均衡價(jià)格等于邊際成本,類似于完全競爭市場均衡。豪泰林(Hotelling)模型:存在產(chǎn)品差異,均衡價(jià)格不等于邊際成本,壟斷性提高11/24/2022博弈論(陳艷)1.3-3豪泰林模型寡頭企業(yè)競爭戰(zhàn)略是價(jià)格10/22/20236假定長度為1的線性城市,消費(fèi)者均勻分布在[0,1]區(qū)間內(nèi),分布密度為1;兩個(gè)商店1、2分別位于x=0,x=1,即城市的兩端;消費(fèi)者購買商品的旅行成本與商店的距離成比例,單位距離的成本為t;住在x的消費(fèi)者在兩個(gè)商店之間是無差異的,需求D1=x,D2=1-x,x滿足:p1+tx=p2+t(1-x),解得x=(p2-p1+t)/2t。0x1商店1商店2豪泰林模型:以空間上差異為例11/24/2022博弈論(陳艷)假定長度為1的線性城市,消費(fèi)者均勻分布在[0,1]區(qū)間內(nèi),分37豪泰林模型:以空間上差異為例根據(jù)兩個(gè)商店的利潤函數(shù),1=(p1-c)x,2=(p2-c)(1-x)選擇使利潤最大化的價(jià)格,得到一階條件,求得p1*=p2*=c+t,均衡利潤1=2=t/2旅行成本越高,產(chǎn)品差異越大,均衡價(jià)格從而均衡利潤也越高。原因:隨著旅行成本上升,不同商店出售的產(chǎn)品之間的替代性下降,每個(gè)商店對(duì)附近的消費(fèi)者的壟斷能力加強(qiáng),當(dāng)旅行成本為零時(shí),不同商店的產(chǎn)品之間具有完全的替代性,則為伯川德均衡結(jié)果。11/24/2022博弈論(陳艷)豪泰林模型:以空間上差異為例根據(jù)兩個(gè)商店的利潤函數(shù),1=(381.3-4公共地的悲劇生物學(xué)家和生態(tài)學(xué)家哈丁(GarrettHarden)在《科學(xué)》(1968年,第162卷)發(fā)表《公地的悲劇》??紤]一塊對(duì)所有的人都開放的牧場,在該制度下,可以預(yù)期,每一個(gè)放牧的人都會(huì)在公地上放牧盡可能多的牲口。增加一頭牲口既有正效用,也有負(fù)效用。正效用是牲口的銷售收入,增加一頭為+1負(fù)效用使每增加一頭帶來的過度放牧的損失,每一個(gè)放牧著承擔(dān)-1/n放牧者合理的決策是增加牲口,直至馬瘦毛長,公地毀滅。11/24/2022博弈論(陳艷)1.3-4公共地的悲劇生物學(xué)家和生態(tài)學(xué)家哈丁(Garrett39資源沒有排他性產(chǎn)權(quán):草地放牧、公海捕魚、小煤窯的過度開發(fā);另一類是人們向其中排放廢物的公地。草地放牧:n個(gè)農(nóng)民,每個(gè)擁有羊的數(shù)量為gi,G=gi,v(G)代表每只羊的價(jià)值,與草地上放牧的總數(shù)G相關(guān),飼養(yǎng)量增加到一定程度,隨著數(shù)量繼續(xù)增加,羊的價(jià)值會(huì)下降,即v’(G)<0農(nóng)民的利潤函數(shù)i=giv(gj)-gic最優(yōu)化的一階條件:i/gi=v(G)+giv’(G)-c=0增加一只羊有正效應(yīng)(羊的價(jià)值)、負(fù)效應(yīng)(新增羊使之前所有羊的價(jià)值下降)個(gè)人邊際成本小于社會(huì)邊際成本,個(gè)人最優(yōu)決定的飼養(yǎng)總量大于社會(huì)最優(yōu)決定的飼養(yǎng)總量11/24/2022博弈論(陳艷)資源沒有排他性產(chǎn)權(quán):草地放牧、公海捕魚、小煤窯的過度開發(fā);另401.3-5斗雞博弈0,00,2退2,0-3,-3進(jìn)退進(jìn)12支付11/24/2022博弈論(陳艷)1.3-5斗雞博弈0,00,2退2,0-3,-3進(jìn)退進(jìn)1241“斗雞博弈”的擴(kuò)展夫妻間吵架警察與游行隊(duì)伍公共產(chǎn)品的供給(兩富戶修路)11/24/2022博弈論(陳艷)“斗雞博弈”的擴(kuò)展夫妻間吵架10/22/2022博弈論(陳艷42第四節(jié)混合戰(zhàn)略納什均衡有些博弈不存在(純策略的)納什均衡社會(huì)福利博弈之例:不存在納什均衡猜謎游戲之例:不存在納什均衡B正面反面A正面反面-1,11,-11,-1-1,1流浪漢找工作游蕩政府救濟(jì)不救濟(jì)3,2-1,3-1,10,011/24/2022博弈論(陳艷)第四節(jié)混合戰(zhàn)略納什均衡有些博弈不存在(純策略的)納什均衡B43設(shè)流浪漢找工作的概率為p,則游蕩為1-p政府的支付:當(dāng)政府救濟(jì),政府得到3p-(1-p)=4p-1當(dāng)政府不救濟(jì),政府得到-p+0=-p流浪漢應(yīng)比較兩種策略:4p-1>-p,p>0.2或者4p-1<-p,p<0.2設(shè)政府救濟(jì)的概率為q,則不救濟(jì)為1-q流浪漢的支付:找工作2q+1-q=q+1游蕩3q+0=3q如果政府打算鼓勵(lì)他找工作,須q+1>3q,q<0.511/24/2022博弈論(陳艷)設(shè)流浪漢找工作的概率為p,則游蕩為1-p10/22/202244基本概念純戰(zhàn)略:參與人在每一個(gè)給定信息的情況下只選擇一個(gè)特定的行動(dòng)混合戰(zhàn)略:參與人在每一個(gè)給定信息的情況下以某種概率分布隨機(jī)地選擇不同的行動(dòng)純戰(zhàn)略可視為混合戰(zhàn)略的特例“流浪漢”的納什均衡:政府以0.5救濟(jì),流浪漢以0.2找工作11/24/2022博弈論(陳艷)基本概念純戰(zhàn)略:參與人在每一個(gè)給定信息的情況下只選擇一個(gè)特定45一個(gè)參與人使用混合策略的好處是給對(duì)方造成不確定性,渾水摸魚海薩尼對(duì)混合戰(zhàn)略的解釋:混合戰(zhàn)略等價(jià)于不完全信息下的純戰(zhàn)略均衡如稅收檢查,檢查則不偷稅,不檢查則偷稅。但稅務(wù)局檢查有成本,企業(yè)在知道稅務(wù)局可能檢查的情況下,偷稅有風(fēng)險(xiǎn)。此時(shí),可以根據(jù)某些參數(shù)尋找一個(gè)混合策略的納什均衡幾乎所有有限博弈都有有限奇數(shù)個(gè)納什均衡。如果一個(gè)博弈有兩個(gè)純戰(zhàn)略納什均衡,那么,一定存在第三個(gè)混合戰(zhàn)略納什均衡11/24/2022博弈論(陳艷)一個(gè)參與人使用混合策略的好處是給對(duì)方造成不確定性,渾水摸魚1461.4-1混合戰(zhàn)略(mixedstrategies)定義:*=(1*,…,n*)=(i*,-i*)是一納什混合戰(zhàn)略均衡,當(dāng)且僅當(dāng)對(duì)所有參與人而言,i*是-i*的最適反應(yīng),ui(i*,-i*)ui(I’,-i*),對(duì)所有i’i成立)。持混合戰(zhàn)略的前提是在均衡時(shí)兩種戰(zhàn)略的報(bào)酬會(huì)相等,是預(yù)期支付最大化的推導(dǎo)結(jié)果。11/24/2022博弈論(陳艷)1.4-1混合戰(zhàn)略(mixedstrategies)定義:47擲硬幣-1,11,-1反面1,-1-1,1正面反面正面12支付p1-pq1-q參與人1:maxEu=q(p(-1)+(1-p)1)+(1-q)(p1+(1-p)(-1))=-pq+q-pq+p-pq-1+q+p-pq=-4pq+2q+2p-1一階條件為零求得:p=1/211/24/2022博弈論(陳艷)擲硬幣-1,11,-1反面1,-1-1,1正面反面正面12支48擲硬幣的分析給定參與人1(q,1-q),參與人2的支付是:q+(-1)(1-q)(正面)=(-1)q+(1-q)(反面);給定參與人2(p,1-p),參與人1的支付為:p(-1)+(1-p)(正面)=p+(-1)(1-p)(反面);求得(1/2,1/2)是納什混合戰(zhàn)略均衡如果兩種戰(zhàn)略報(bào)酬不相等,那么就變?yōu)榧儜?zhàn)略(purestrategies)了。11/24/2022博弈論(陳艷)擲硬幣的分析給定參與人1(q,1-q),參與人2的支付是:q491.4-2混合戰(zhàn)略均衡的博弈原則兩博弈方不能讓對(duì)方知道或猜到自己的選擇,因而必須在決策時(shí)利用隨機(jī)性;兩博弈方選擇每種策略的概率一定要恰好使對(duì)方無機(jī)可乘,即讓對(duì)方無法通過針對(duì)性地傾向某一策略而在博弈中占上風(fēng)。例:在擲硬幣的博弈中,參與人1選正面、反面的概率q,1-q,一定要使參與人2選正面的和反面的期望得益相等。11/24/2022博弈論(陳艷)1.4-2混合戰(zhàn)略均衡的博弈原則兩博弈方不能讓對(duì)方知道或猜到50單純戰(zhàn)略與混合戰(zhàn)略的定義G={N,S,U}是一個(gè)戰(zhàn)略式有限博弈,參與人i的戰(zhàn)略空間S中的任一元素si稱為i的一個(gè)單純戰(zhàn)略(purestrategy);定義在Si上的一個(gè)概率分布函數(shù)pi(si)代表了一個(gè)混合戰(zhàn)略(mixedstrategy)——這個(gè)戰(zhàn)略的內(nèi)容是:參與人i以概率pi(sij)選擇單純戰(zhàn)略sij,而pi(sij)=1。單純戰(zhàn)略是混合戰(zhàn)略的特例,因?yàn)槿我粏渭儜?zhàn)略si都可以理解為i以概率1選擇si,以0概率選取其他所有單純戰(zhàn)略。引入混合戰(zhàn)略,參與人的目標(biāo)需要修改為“最大化自己的期望支付”11/24/2022博弈論(陳艷)單純戰(zhàn)略與混合戰(zhàn)略的定義G={N,S,U}是一個(gè)戰(zhàn)略式有限博51Selton:小偷和守衛(wèi)的博弈一小偷欲偷竊有一守衛(wèi)看守的倉庫,如果小偷偷竊時(shí)守衛(wèi)在睡覺,則小偷就能得手,偷得價(jià)值為V的贓物;如果小偷偷竊時(shí)守衛(wèi)沒有睡覺,則小偷就會(huì)被抓住。設(shè)小偷被抓后要坐牢,負(fù)效用為-P,守衛(wèi)睡覺而未遭偷竊有S的正效用,因睡覺被竊要被解雇,其負(fù)效用為-D。而如果小偷不偷,則他既無得也無失,守衛(wèi)不睡意味著出一份力掙一分錢,他也沒有得失。11/24/2022博弈論(陳艷)Selton:小偷和守衛(wèi)的博弈一小偷欲偷竊有一52睡不睡偷V,-D-P,0不偷0,S0,0小偷守衛(wèi)支付小偷與守衛(wèi)的博弈11/24/2022博弈論(陳艷)小偷守衛(wèi)支付小偷與守衛(wèi)的博弈10/22/2022博弈論(陳艷53守衛(wèi)得益(睡)S01pt(小偷偷的概率)pt*pt*/-D-D/小偷的混合策略S到-D連線的縱坐標(biāo)是在橫坐標(biāo)對(duì)應(yīng)的小偷“偷”竊概率下的守衛(wèi)選擇“睡”的期望得益,即S(1-pt)+(-D)pt加重對(duì)守衛(wèi)的處罰在短期中的效果是使守衛(wèi)真正盡職,但在長期中恰恰是會(huì)降低盜竊發(fā)生的概率(激勵(lì)的悖論)11/24/2022博弈論(陳艷)守衛(wèi)得益(睡)S01pt(小偷偷的概率)pt*pt*/-D-54小偷得益(偷)V01Pg(守衛(wèi)睡的概率)Pg*Pg*/-P-P/守衛(wèi)的混合策略小偷的混合策略分布不受P的影響,因此政府加重對(duì)小偷的懲罰在長期中并不能抑制盜竊,最多只能抑制短期的盜竊發(fā)生率,它的作用主要是使守衛(wèi)可以更多地偷懶11/24/2022博弈論(陳艷)小偷得益(偷)V01Pg(守衛(wèi)睡的概率)Pg*Pg*/-P-55齊威王田忌賽馬古代齊威王與大將田忌賽馬,田忌的謀士孫臏運(yùn)用計(jì)謀幫助田忌以弱勝強(qiáng)。比賽規(guī)則:田忌與齊威王各出三匹馬,一對(duì)一比賽三場,每一場的輸方要賠1000斤銅給贏方。雙方的馬按實(shí)力都可以分為上、中、下,但齊威王的上、中、下均優(yōu)于田忌的上、中、下。實(shí)際上,田忌的上馬、中馬要優(yōu)于齊威王的中馬、下馬。比賽結(jié)果:田忌連輸三場;后孫臏建議,以上對(duì)中、以中對(duì)下、以下對(duì)上,結(jié)果以2:1贏得比賽。11/24/2022博弈論(陳艷)齊威王田忌賽馬古代齊威王與大將田忌賽馬,田忌的謀士孫臏運(yùn)用計(jì)56前述為單方面運(yùn)用策略的故事,如果齊威王預(yù)料到田忌的做法,必然會(huì)改變各匹馬出場的次序。本博弈中博弈雙方的利益是完全對(duì)立的,是嚴(yán)格競爭的零和博弈,不會(huì)有純策略納什均衡,必然是一個(gè)混合策略均衡。假設(shè)齊威王采取六種戰(zhàn)略的概率分別為pa,pb,pc,pd,pe,pf(加總為1),則田忌采取六種戰(zhàn)略的期望得益相等,則得出齊威王與田忌均以1/6的相同概率隨機(jī)選擇各自的六個(gè)純策略,構(gòu)成本博弈唯一的混合策略納什均衡。齊威王田忌賽馬11/24/2022博弈論(陳艷)前述為單方面運(yùn)用策略的故事,如果齊威王預(yù)料到田忌的做法,必然57上中下上下中中上下中下上下上中下中上上中下3,-31,-11,-11,-1-1,11,-1上下中1,-13,-31,-11,-11,-1-1,1中上下1,-1-1,13,-31,-11,-11,-1中下上-1,11,-11,-13,-31,-11,-1下上中1,-11,-11,-1-1,13,-31,-1下中上1,-11,-1-1,11,-11,-13,-3齊威王田忌齊威王田忌賽馬11/24/2022博弈論(陳艷)上中下上下中中上下中下上下上中下中上上中下3,-31,-1158齊威王田忌賽馬在上述混合策略下,齊威王的期望得益為1/6(3+1+1+1+1-1)=1;田忌的期望得益為1/6(1-3-1-1-1-1)=-1,即多次進(jìn)行這樣的賽馬,齊威王平均每次能贏田忌1000斤銅,這是因?yàn)辇R威王三匹馬的總體實(shí)力略勝田忌三匹馬總體實(shí)力的緣故11/24/2022博弈論(陳艷)齊威王田忌賽馬在上述混合策略下,齊威王的期望得益591.4-3混合策略反應(yīng)函數(shù)將博弈方的策略空間擴(kuò)展到包括混合策略,將納什均衡擴(kuò)展到包括混合策略納什均衡以后,求納什均衡反應(yīng)函數(shù)的分析方法也可以擴(kuò)展到求混合策略納什均衡。反應(yīng)函數(shù)即一博弈方對(duì)另一博弈方每種可能的決策內(nèi)容的最佳反映決策構(gòu)成的函數(shù)。在純策略的范疇內(nèi),反應(yīng)函數(shù)是各博弈方選擇的純策略對(duì)其他博弈方純策略的反應(yīng)。在混合策略的范疇內(nèi),博弈方的決策內(nèi)容為選擇概率分布,反應(yīng)函數(shù)就是一方對(duì)另一方的概率分布的反應(yīng)。11/24/2022博弈論(陳艷)1.4-3混合策略反應(yīng)函數(shù)將博弈方的策略空間擴(kuò)展到包括混合策60擲硬幣-1,11,-1反面1,-1-1,1正面反面正面12支付q1-q1-pp11/24/2022博弈論(陳艷)擲硬幣-1,11,-1反面1,-1-1,1正面反面正面12支61pq01/2111/2p1=f(q)q2=f(p)當(dāng)2出正面的概率q1/2,1出正面的概率為1,因?yàn)樗稣娴玫降念A(yù)期收益大于他出反面;當(dāng)2出正面的概率q1/2,1出正面的概率為0,因?yàn)樗龇疵娴钠谕找娲笥谒稣妗?1/24/2022博弈論(陳艷)pq01/2111/2p1=f(q)q2=f(p)當(dāng)2出正面62第五節(jié)納什均衡的存在性與多重性11/24/2022博弈論(陳艷)第五節(jié)納什均衡的存在性與多重性10/22/2022博弈論(63混合戰(zhàn)略納什均衡純戰(zhàn)略納什均衡重復(fù)剔除占優(yōu)均衡占優(yōu)均衡不同均衡概念之間的關(guān)系11/24/2022博弈論(陳艷)占優(yōu)均衡不同均衡概念之間的關(guān)系10/22/2022博弈論(陳64納什均衡的存在性每個(gè)有限戰(zhàn)略式博弈(參與人與戰(zhàn)略數(shù)目均為有限)都有納什均衡存在,這均衡有可能是混合戰(zhàn)略均衡納什均衡的多重性納什均衡不唯一,如性別戰(zhàn)11/24/2022博弈論(陳艷)納什均衡的存在性10/22/2022博弈論(陳艷)65案例性別戰(zhàn)1,30,0足球0,02,1時(shí)裝足球時(shí)裝妻子支付p1-pq1-q丈夫11/24/2022博弈論(陳艷)案例性別戰(zhàn)1,30,0足球0,02,1時(shí)裝足球時(shí)裝妻子支付66性別戰(zhàn):混合策略均衡給定妻子分別以q,1-q的概率選擇時(shí)裝、足球,則丈夫選擇時(shí)裝、足球的期望收益相等,即1.q+0.(1-q)=0.q+3.(1-q),解得妻子選擇時(shí)裝、足球的概率分別為(3/4,1/4)給定丈夫分別以p,1-p的概率選擇時(shí)裝、足球,則妻子選擇時(shí)裝、足球的期望收益相等,即2.p+0.(1-p)=0.p+1.(1-p),解得妻子選擇時(shí)裝、足球的概率分別為(1/3,2/3)11/24/2022博弈論(陳艷)性別戰(zhàn):混合策略均衡給定妻子分別以q,1-q的概率選擇時(shí)裝、67當(dāng)妻子以(3/4,1/4)的概率分布隨機(jī)選擇時(shí)裝表演和足球,丈夫以(1/3,2/3)的概率隨機(jī)選擇時(shí)裝表演和足球時(shí),雙方都無法通過單獨(dú)改變策略,即單獨(dú)改變隨機(jī)選擇純策略的概率分布而提高利益,因此雙方的上述概率分布的組合構(gòu)成一個(gè)混合策略納什均衡。該混合策略納什均衡給妻子和丈夫各自帶來的期望收益分別為:q.p.2+q.(1-p).0+(1-q).p.0+(1-q).(1-p).1=2/3;q.p.1+q.(1-p).0+(1-q).p.0+(1-q).(1-p).3=3/4雙方的期望收益均小于純策略時(shí)的期望收益。性別戰(zhàn):混合策略均衡11/24/2022博弈論(陳艷)當(dāng)妻子以(3/4,1/4)的概率分布隨機(jī)選擇時(shí)裝表演和足球,68qp01/3113/4q1=f(p)p2=f(q)夫妻之爭兩博弈方的反應(yīng)函數(shù)如果p1/3,則妻子選擇時(shí)裝的期望得益小于選擇足球,因此妻子應(yīng)選擇足球,即q=0;如果p1/3,則妻子選擇時(shí)裝的期望得益為大于選擇足球的得益,因此選時(shí)裝,即q=111/24/2022博弈論(陳艷)qp01/3113/4q1=f(p)p2=f(q)夫妻之爭兩69焦點(diǎn)均衡(focalpoint)當(dāng)一個(gè)博弈有多個(gè)納什均衡時(shí),博弈論并沒有一個(gè)一般的理論來證明納什均衡結(jié)果一定會(huì)出現(xiàn)。在現(xiàn)實(shí)生活中,參與人可能使用某些被博弈模型抽象掉的信息來達(dá)到一個(gè)“焦點(diǎn)”均衡。這些信息可能與社會(huì)文化習(xí)慣、參與人過去博弈的歷史有關(guān)。例,在性別戰(zhàn)中,如果今天是丈夫的生日,(足球、足球)可能是一個(gè)焦點(diǎn)均衡;而如果是妻子的生日,(時(shí)裝、時(shí)裝)可能是一個(gè)焦點(diǎn)均衡。還有分蛋糕等。11/24/2022博弈論(陳艷)焦點(diǎn)均衡(focalpoint)當(dāng)一個(gè)博弈有多個(gè)納什均衡時(shí)70課堂練習(xí):求納什均衡2,40,0音樂會(huì)1,14,2足球音樂會(huì)足球男方女方支付p1-pq1-q11/24/2022博弈論(陳艷)課堂練習(xí):求納什均衡2,40,0音樂會(huì)1,14,2足球音樂會(huì)71市場進(jìn)入阻撓0,3000,300不進(jìn)入-10,040,50進(jìn)入斗爭默許進(jìn)入者在位者支付威脅是可置信的嗎?11/24/2022博弈論(陳艷)市場進(jìn)入阻撓0,3000,300不進(jìn)入-10,040,5072作業(yè)1
春節(jié)前夕,某小鎮(zhèn)上兩個(gè)商鋪主甲和乙同時(shí)看到一個(gè)賺錢機(jī)會(huì):去城里販一批鞭炮回來零售,購貨款加上運(yùn)輸費(fèi)用共5000元,如果沒有競爭對(duì)手,這批貨在小鎮(zhèn)上能賣6000元;但如果另一家商鋪同時(shí)在小鎮(zhèn)上賣鞭炮,價(jià)格下跌使得這批鞭炮只能賣4000元。請(qǐng)用戰(zhàn)略式表示支付矩陣;請(qǐng)找出納什均衡。11/24/2022博弈論(陳艷)作業(yè)1春節(jié)前夕,某小鎮(zhèn)上兩個(gè)商鋪主甲和乙同時(shí)看到一個(gè)賺錢73作業(yè)二2,01,14,23,41,22,31,30,23,0乙左中右上中下甲一個(gè)兩人同時(shí)博弈的支付競爭如下所示,試求納什均衡。是否存在重復(fù)剔除占優(yōu)戰(zhàn)略均衡?11/24/2022博弈論(陳艷)作業(yè)二2,01,14,23,41,22,31,30,23,074第一章:完全信息靜態(tài)博弈本章內(nèi)容:博弈論的基本概念及戰(zhàn)略式表述納什均衡納什均衡應(yīng)用舉例混合戰(zhàn)略納什均衡納什均衡的存在性與多重性11/24/2022博弈論(陳艷)第一章:完全信息靜態(tài)博弈本章內(nèi)容:10/22/2022博弈論75第一節(jié)博弈論的基本概念
與戰(zhàn)略式表述博弈論的基本概念戰(zhàn)略式表述11/24/2022博弈論(陳艷)第一節(jié)博弈論的基本概念
與戰(zhàn)略式表述博弈論的基本概念10/761.1-1基本概念1、參與人:一個(gè)博弈中的決策主體,其目的是通過選擇行動(dòng)(或戰(zhàn)略)以最大化自己的支付(效用)水平。“自然”作為虛擬參與人來處理。是指決定外生的隨機(jī)變量的概率分布的機(jī)制。i=1,…,n代表參與人,N代表自然11/24/2022博弈論(陳艷)1.1-1基本概念1、參與人:一個(gè)博弈中的決策主體,其目的是772、行動(dòng):行動(dòng)是指參與人在博弈的某個(gè)時(shí)點(diǎn)的決策變量。用ai表示第i個(gè)參與人的一個(gè)特定行動(dòng),Ai={ai}表示可供i選擇的所有行動(dòng)的集合。3、信息:是參與人有關(guān)博弈的知識(shí),特別是有關(guān)“自然”的選擇、其他參與人的特征和行動(dòng)的知識(shí)。信息集完美信息:一個(gè)參與人對(duì)其他參與人(包括虛擬參與人“自然”)的行動(dòng)選擇有準(zhǔn)確了解的情況,即每個(gè)信息集只包含一個(gè)值完全信息:自然不首先行動(dòng)或自然的初始行動(dòng)被所有參與人準(zhǔn)確觀察到的情況,即沒有事前的不確定性。共同知識(shí):所有參與人知道,所有參與人知道所有參與人知道,所有參與人知道所有參與人知道所有參與人知道…的知識(shí)。一致信念:即使所有參與人“共同”享有某種知識(shí),每個(gè)參與人也可能不知道其他參與人知道這些知識(shí),或者并不知道其他人知道自己擁有這些知識(shí)。11/24/2022博弈論(陳艷)2、行動(dòng):行動(dòng)是指參與人在博弈的某個(gè)時(shí)點(diǎn)的決策變量。用ai表784、戰(zhàn)略:是參與人在給點(diǎn)信息集的情況下的行動(dòng)規(guī)則,它規(guī)定參與人在什么時(shí)候選擇什么行動(dòng)。用si表示第i個(gè)參與人的一個(gè)特定戰(zhàn)略,Si={si}代表第i個(gè)參與人的所有可選擇的戰(zhàn)略集合。5、支付:在博弈論中,支付或者是指在一個(gè)特定的戰(zhàn)略組合下參與人得到的確定效用水平,或者是指參與人得到的期望效用水平。令ui為第i個(gè)參與人的支付(效用水平),u=(u1,…,ui,…,un)為n個(gè)參與人的支付組合。于是ui=ui(s1,…,si,…,sn),即ui是所有參與人的戰(zhàn)略選擇的函數(shù)。11/24/2022博弈論(陳艷)4、戰(zhàn)略:是參與人在給點(diǎn)信息集的情況下的行動(dòng)規(guī)則,它規(guī)定參與796、結(jié)果:是博弈分析者所感興趣的所有東西,如均衡戰(zhàn)略組合、均衡行動(dòng)組合、均衡支付組合等。7、均衡:是所有參與人的最優(yōu)戰(zhàn)略的組合,一般記為:s*=(s1*,…,si*,…,sn*)。為了把一個(gè)特定參與人與其他參與人相區(qū)別,我們將用s-i=(s1,…,si-1,si+1,…,sn)表示由除i之外的所有參與人的戰(zhàn)略組成的向量。博弈論(gametheory)是研究決策主體的行為發(fā)生直接相互作用時(shí)候的決策以及這種決策的均衡問題。11/24/2022博弈論(陳艷)6、結(jié)果:是博弈分析者所感興趣的所有東西,如均衡戰(zhàn)略組合、均801.1-2博弈論的戰(zhàn)略式表達(dá)一個(gè)博弈可以用兩種不同的方式來表述,一種是戰(zhàn)略式表述,另一種是擴(kuò)展式表述。盡管從理論上講,這兩種表述形式幾乎是完全等價(jià)的,但從分析的方便性的角度看,戰(zhàn)略式表述更適合于靜態(tài)博弈,而擴(kuò)展式表述更適合于討論動(dòng)態(tài)博弈。博弈的戰(zhàn)略式表述:G={N,(Si)iN,(Ui)iN}有三個(gè)基本要素:(1)參與人(players)iN={1,2,…,n};(2)戰(zhàn)略(strategies),siSi(戰(zhàn)略空間);(3)支付(payoffs),ui=ui(s-i,si)。11/24/2022博弈論(陳艷)1.1-2博弈論的戰(zhàn)略式表達(dá)一個(gè)博弈可以用兩種不同的方式來表81案例1:囚犯困境抵賴坦白抵賴-1,-1-9,0坦白0,-9-6,-6支付嫌疑人B嫌疑人A11/24/2022博弈論(陳艷)案例1:囚犯困境支付嫌疑人B嫌疑人A10/22/2022博82均衡與均衡結(jié)果均衡戰(zhàn)略(坦白,坦白)均衡支付(-6,-6)11/24/2022博弈論(陳艷)均衡與均衡結(jié)果均衡戰(zhàn)略(坦白,坦白)10/22/2022博弈83第二節(jié)納什均衡占優(yōu)戰(zhàn)略均衡重復(fù)剔除的占優(yōu)戰(zhàn)略均衡納什均衡11/24/2022博弈論(陳艷)第二節(jié)納什均衡占優(yōu)戰(zhàn)略均衡10/22/2022博弈論(陳艷841.2-1完全信息靜態(tài)博弈的幾點(diǎn)特性1、每個(gè)參與人對(duì)所有其他參與人的特征(包括戰(zhàn)略空間、支付函數(shù)等)有完全的了解,即知道博弈結(jié)構(gòu)與游戲規(guī)則(共同知識(shí))但不知道其他人的行動(dòng)。2、所有參與人同時(shí)選擇行動(dòng)且只行動(dòng)一次。同時(shí)行動(dòng),是一個(gè)信息概念而非時(shí)間概念:只要每個(gè)參與人在選擇自己的行動(dòng)時(shí)不知道其他參與人的選擇,我們就說他們?cè)谕瑫r(shí)行動(dòng)。3、不管是否溝通過,無法做出有約束力的承諾(非合作)11/24/2022博弈論(陳艷)1.2-1完全信息靜態(tài)博弈的幾點(diǎn)特性1、每個(gè)參與人對(duì)所有其他851.2-1占優(yōu)戰(zhàn)略均衡占優(yōu)戰(zhàn)略:不管對(duì)手戰(zhàn)略為何,該參與人可找到一最佳戰(zhàn)略。一般地,si*稱為參與人i的(嚴(yán)格)占優(yōu)戰(zhàn)略。定義:在博弈G={N,(Si)iN,(Ui)iN}中,如果對(duì)所有的參與人i,si*是它的占優(yōu)戰(zhàn)略,那么所有參與人選擇的戰(zhàn)略組合(s1*,…,sn*)成為該對(duì)策的占優(yōu)戰(zhàn)略均衡。11/24/2022博弈論(陳艷)1.2-1占優(yōu)戰(zhàn)略均衡占優(yōu)戰(zhàn)略:不管對(duì)手戰(zhàn)略為何,該參與人可86案例1:囚犯困境抵賴坦白抵賴-1,-1-9,0坦白0,-9-6,-6支付嫌疑人B嫌疑人A11/24/2022博弈論(陳艷)案例1:囚犯困境支付嫌疑人B嫌疑人A10/22/2022博87囚犯困境的擴(kuò)展應(yīng)該指出,占優(yōu)戰(zhàn)略均衡只要求每個(gè)參與人是理性的,而并不要求每個(gè)參與人知道其他參與人是理性的從“納什均衡”引出“看不見的手”的一個(gè)悖論:從利己目的出發(fā),結(jié)果損人不利己。“納什均衡”提出的悖論動(dòng)搖了經(jīng)濟(jì)學(xué)的基石。兩個(gè)寡頭企業(yè)選擇產(chǎn)量公共產(chǎn)品的供給軍備競賽經(jīng)濟(jì)改革結(jié)論:一種制度安排,要發(fā)生效力。必須是一種納什均衡;否則,制度安排便不能成立。11/24/2022博弈論(陳艷)囚犯困境的擴(kuò)展應(yīng)該指出,占優(yōu)戰(zhàn)略均衡只要求每個(gè)參與人是理性的88價(jià)格大戰(zhàn)低價(jià)高價(jià)低價(jià)3,36,1高價(jià)1,65,5百事可樂可口可樂支付11/24/2022博弈論(陳艷)價(jià)格大戰(zhàn)百事可樂可口可樂支付10/22/2022博弈論(陳艷891.2-2重復(fù)剔除的占優(yōu)戰(zhàn)略均衡絕對(duì)劣勢戰(zhàn)略:si是一絕對(duì)劣勢戰(zhàn)略當(dāng)且僅當(dāng)存在另一戰(zhàn)略si’Si使得ui(si,s-i)<ui(si’,s-i)對(duì)所有s-iS-i均成立。(si’未必是優(yōu)勢戰(zhàn)略)重復(fù)剔除的占優(yōu)戰(zhàn)略均衡:逐次刪去絕對(duì)劣勢戰(zhàn)略得到唯一的占優(yōu)戰(zhàn)略。首先找出某個(gè)參與人的劣戰(zhàn)略,剔除之,再找,再剔除,直到最后的一個(gè)11/24/2022博弈論(陳艷)1.2-2重復(fù)剔除的占優(yōu)戰(zhàn)略均衡絕對(duì)劣勢戰(zhàn)略:si是一絕對(duì)劣90案例2:智豬博弈豬圈里圈兩頭豬,一頭大豬,一頭小豬。豬圈的一頭有一個(gè)豬食槽,另一頭安裝一個(gè)按鈕,控制著豬食的供應(yīng)。按一下按鈕會(huì)有10個(gè)單位的豬食進(jìn)槽,但誰按按鈕誰就要付出2個(gè)單位的成本。若大豬先到,大豬吃到9個(gè)單位,小豬只能吃1個(gè)單位;若同時(shí)到,大豬吃7個(gè)單位,小豬吃3個(gè)單位;若小豬先到,大豬吃6個(gè)單位,小豬吃4個(gè)單位。支付如表。11/24/2022博弈論(陳艷)案例2:智豬博弈豬圈里圈兩頭豬,一頭大豬,一頭小豬。豬圈的一91案例2:智豬博弈0,09,-1等待4,45,1按等待按支付小豬大豬11/24/2022博弈論(陳艷)案例2:智豬博弈支付小豬大豬10/22/2022博弈論(陳92智豬博弈的擴(kuò)展股份公司承擔(dān)監(jiān)督經(jīng)理職能的大股東與小股東股票市場上炒股票的大戶與小戶市場中大企業(yè)與小企業(yè)在研發(fā)、廣告上的博弈公共產(chǎn)品的提供(富戶與窮戶)改革中不同利益分配對(duì)改革的推動(dòng)11/24/2022博弈論(陳艷)智豬博弈的擴(kuò)展股份公司承擔(dān)監(jiān)督經(jīng)理職能的大股東與小股東10/93例:重復(fù)剔除的占優(yōu)戰(zhàn)略均衡
首先剔除R1,01,20,10,30,12,0參與人2LMR參與人1UD11/24/2022博弈論(陳艷)例:重復(fù)剔除的占優(yōu)戰(zhàn)略均衡
首先剔除R94例:重復(fù)剔除的占優(yōu)戰(zhàn)略均衡
其次剔除D1,01,20,30,1參與人2LM參與人1UD11/24/2022博弈論(陳艷)例:重復(fù)剔除的占優(yōu)戰(zhàn)略均衡
其次剔除D參與人295例:重復(fù)剔除的占優(yōu)戰(zhàn)略均衡
最后剔除L1,01,2參與人2LM參與人1U最后均衡結(jié)果:(U,M)11/24/2022博弈論(陳艷)例:重復(fù)剔除的占優(yōu)戰(zhàn)略均衡
最后剔除L參與人296例重復(fù)剔除的占優(yōu)戰(zhàn)略均衡4,35,16,22,18,43,63,09,62,8參與人2LMR參與人1UDN11/24/2022博弈論(陳艷)例重復(fù)剔除的占優(yōu)戰(zhàn)略均衡97例重復(fù)剔除的占優(yōu)戰(zhàn)略均衡參與人2LMR參與人1UDN1,01,33,00,20,13,00,22,45,311/24/2022博弈論(陳艷)例重復(fù)剔除的占優(yōu)戰(zhàn)略均衡981.2-3納什均衡定義:指一戰(zhàn)略組合有以下特性:當(dāng)參與人持此戰(zhàn)略后,任一參與人均無誘因偏離這一均衡;s*=(s1*,…,sn*)=(si*,s-i*)是一納什均衡,當(dāng)且僅當(dāng)對(duì)所有參與人而言,ui(si*,s-i*)ui(si’,s-i*)對(duì)所有si’Si均成立。簡單而言,當(dāng)s1*是對(duì)s2*的最適反應(yīng),s2*也是s1*的最適反應(yīng)時(shí),(s1*,s2*)就是二人博弈的納什均衡。命題1:納什均衡在占優(yōu)戰(zhàn)略重復(fù)剔除解法中不會(huì)被剔除命題2:重復(fù)剔除的嚴(yán)格占優(yōu)戰(zhàn)略均衡一定是納什均衡。11/24/2022博弈論(陳艷)1.2-3納什均衡定義:指一戰(zhàn)略組合有以下特性:當(dāng)參與人持此99例納什均衡求解0,44,05,34,00,45,33,53,56,6參與人2LMR參與人1UDN11/24/2022博弈論(陳艷)例納什均衡求解參與人2100三者之間的關(guān)系1、每一個(gè)占優(yōu)戰(zhàn)略均衡、重復(fù)剔除的占優(yōu)均衡一定是納什均衡,但并非每一個(gè)納什均衡都是占優(yōu)戰(zhàn)略均衡或重復(fù)剔除的占優(yōu)均衡。2、納什均衡一定是在重復(fù)剔除嚴(yán)格劣戰(zhàn)略過程中沒有被剔除掉的戰(zhàn)略組合,但沒有被剔除的戰(zhàn)略組合不一定是納什均衡,除非它是唯一的。11/24/2022博弈論(陳艷)三者之間的關(guān)系1、每一個(gè)占優(yōu)戰(zhàn)略均衡、重復(fù)剔除的占優(yōu)均衡一定101作業(yè)7,76,67,65,75,88,56,65,84,8乙左中右上中下甲一個(gè)兩人同時(shí)博弈的支付競爭如下所示,試求納什均衡。是否存在重復(fù)剔除占優(yōu)戰(zhàn)略均衡?11/24/2022博弈論(陳艷)作業(yè)7,76,67,65,75,88,56,65,84,8102第三節(jié)納什均衡應(yīng)用舉例古諾(Cournot)寡頭模型沙灘賣冰豪泰林(Hotelling)價(jià)格競爭模型公共地的悲劇11/24/2022博弈論(陳艷)第三節(jié)納什均衡應(yīng)用舉例古諾(Cournot)寡頭模型10/1031.3-1古諾寡頭模型特點(diǎn):存在兩家廠商;同時(shí)行動(dòng)確定產(chǎn)量。通過預(yù)測另一家廠商的產(chǎn)量來選擇自己的利潤最大化產(chǎn)量,尋求預(yù)測均衡。廠商1表示為:maxqiP(q1+q2)-ci(qi),得出q1=f1(q2),同理得出q2=f2(q1),稱為反應(yīng)函數(shù),兩條曲線的交點(diǎn)為古諾模型的解。11/24/2022博弈論(陳艷)1.3-1古諾寡頭模型特點(diǎn):存在兩家廠商;同時(shí)行動(dòng)確定產(chǎn)量。104古諾寡頭模型的納什均衡反應(yīng)函數(shù)q1=f1(q2)q2=f2(q1)(q1*,q2*)是該對(duì)策的納什均衡解。q1*q12q11
q10q2*q22q21q1oq2f1(q2)f2(q1)11/24/2022博弈論(陳艷)古諾寡頭模型的納什均衡反應(yīng)函數(shù)q1*q12q11q105例題:古諾模型的解假設(shè)p=a-(q1+q2),C1=q1c,C2=q2c則根據(jù)利潤最大化的一階條件分別得到反應(yīng)函數(shù)q1=f1(q2)=(a-q2-c)/2,q2=f2(q1)=(a-q1-c)/2,求出均衡產(chǎn)量為(1/3(a-c),1/3(a-c)),為納什均衡,均衡利潤為(1/9(a-c)2,1/9(a-c)2)11/24/2022博弈論(陳艷)例題:古諾模型的解假設(shè)p=a-(q1+q2),C1=q1c,106古諾模型的解:與壟斷市場的比較假設(shè)為一壟斷企業(yè),則有:Max=q(a-q-c),得到壟斷企業(yè)的最優(yōu)產(chǎn)量q=1/2(a-c)q1+q2=2/3(a-c)壟斷利潤為=1/4(a-c)22/9(a-c)2寡頭競爭的總產(chǎn)量大于壟斷產(chǎn)量的原因在于每個(gè)企業(yè)在選擇自己的最優(yōu)產(chǎn)量時(shí),只考慮對(duì)本企業(yè)利潤的影響,而忽視對(duì)另一個(gè)企業(yè)的外部負(fù)效應(yīng)。11/24/2022博弈論(陳艷)古諾模型的解:與壟斷市場的比較假設(shè)為一壟斷企業(yè),則有:10/107寡頭廠商與壟斷廠商的比較1/3(a-c)1/2(a-c)1/2(a-c)q1oq2f1(q2)f2(q1)1/3(a-c)11/24/2022博弈論(陳艷)寡頭廠商與壟斷廠商的比較1/3(a-c)1/21081.3-2沙灘賣冰假設(shè)游客沿沙灘{0,1}間均勻分布,現(xiàn)有兩位賣冰者,他們會(huì)將攤位選在哪個(gè)位置?假設(shè)游客就近購買。生活中還有哪些類似的例子?0???111/24/2022博弈論(陳艷)1.3-2沙灘賣冰假設(shè)游客沿沙灘{0,1}間均勻分布,現(xiàn)有1091.3-3豪泰林模型寡頭企業(yè)競爭戰(zhàn)略是價(jià)格伯川德(Bertrand)模型:產(chǎn)品同質(zhì),均衡價(jià)格等于邊際成本,類似于完全競爭市場均衡。豪泰林(Hotelling)模型:存在產(chǎn)品差異,均衡價(jià)格不等于邊際成本,壟斷性提高11/24/2022博弈論(陳艷)1.3-3豪泰林模型寡頭企業(yè)競爭戰(zhàn)略是價(jià)格10/22/202110假定長度為1的線性城市,消費(fèi)者均勻分布在[0,1]區(qū)間內(nèi),分布密度為1;兩個(gè)商店1、2分別位于x=0,x=1,即城市的兩端;消費(fèi)者購買商品的旅行成本與商店的距離成比例,單位距離的成本為t;住在x的消費(fèi)者在兩個(gè)商店之間是無差異的,需求D1=x,D2=1-x,x滿足:p1+tx=p2+t(1-x),解得x=(p2-p1+t)/2t。0x1商店1商店2豪泰林模型:以空間上差異為例11/24/2022博弈論(陳艷)假定長度為1的線性城市,消費(fèi)者均勻分布在[0,1]區(qū)間內(nèi),分111豪泰林模型:以空間上差異為例根據(jù)兩個(gè)商店的利潤函數(shù),1=(p1-c)x,2=(p2-c)(1-x)選擇使利潤最大化的價(jià)格,得到一階條件,求得p1*=p2*=c+t,均衡利潤1=2=t/2旅行成本越高,產(chǎn)品差異越大,均衡價(jià)格從而均衡利潤也越高。原因:隨著旅行成本上升,不同商店出售的產(chǎn)品之間的替代性下降,每個(gè)商店對(duì)附近的消費(fèi)者的壟斷能力加強(qiáng),當(dāng)旅行成本為零時(shí),不同商店的產(chǎn)品之間具有完全的替代性,則為伯川德均衡結(jié)果。11/24/2022博弈論(陳艷)豪泰林模型:以空間上差異為例根據(jù)兩個(gè)商店的利潤函數(shù),1=(1121.3-4公共地的悲劇生物學(xué)家和生態(tài)學(xué)家哈?。℅arrettHarden)在《科學(xué)》(1968年,第162卷)發(fā)表《公地的悲劇》??紤]一塊對(duì)所有的人都開放的牧場,在該制度下,可以預(yù)期,每一個(gè)放牧的人都會(huì)在公地上放牧盡可能多的牲口。增加一頭牲口既有正效用,也有負(fù)效用。正效用是牲口的銷售收入,增加一頭為+1負(fù)效用使每增加一頭帶來的過度放牧的損失,每一個(gè)放牧著承擔(dān)-1/n放牧者合理的決策是增加牲口,直至馬瘦毛長,公地毀滅。11/24/2022博弈論(陳艷)1.3-4公共地的悲劇生物學(xué)家和生態(tài)學(xué)家哈?。℅arrett113資源沒有排他性產(chǎn)權(quán):草地放牧、公海捕魚、小煤窯的過度開發(fā);另一類是人們向其中排放廢物的公地。草地放牧:n個(gè)農(nóng)民,每個(gè)擁有羊的數(shù)量為gi,G=gi,v(G)代表每只羊的價(jià)值,與草地上放牧的總數(shù)G相關(guān),飼養(yǎng)量增加到一定程度,隨著數(shù)量繼續(xù)增加,羊的價(jià)值會(huì)下降,即v’(G)<0農(nóng)民的利潤函數(shù)i=giv(gj)-gic最優(yōu)化的一階條件:i/gi=v(G)+giv’(G)-c=0增加一只羊有正效應(yīng)(羊的價(jià)值)、負(fù)效應(yīng)(新增羊使之前所有羊的價(jià)值下降)個(gè)人邊際成本小于社會(huì)邊際成本,個(gè)人最優(yōu)決定的飼養(yǎng)總量大于社會(huì)最優(yōu)決定的飼養(yǎng)總量11/24/2022博弈論(陳艷)資源沒有排他性產(chǎn)權(quán):草地放牧、公海捕魚、小煤窯的過度開發(fā);另1141.3-5斗雞博弈0,00,2退2,0-3,-3進(jìn)退進(jìn)12支付11/24/2022博弈論(陳艷)1.3-5斗雞博弈0,00,2退2,0-3,-3進(jìn)退進(jìn)12115“斗雞博弈”的擴(kuò)展夫妻間吵架警察與游行隊(duì)伍公共產(chǎn)品的供給(兩富戶修路)11/24/2022博弈論(陳艷)“斗雞博弈”的擴(kuò)展夫妻間吵架10/22/2022博弈論(陳艷116第四節(jié)混合戰(zhàn)略納什均衡有些博弈不存在(純策略的)納什均衡社會(huì)福利博弈之例:不存在納什均衡猜謎游戲之例:不存在納什均衡B正面反面A正面反面-1,11,-11,-1-1,1流浪漢找工作游蕩政府救濟(jì)不救濟(jì)3,2-1,3-1,10,011/24/2022博弈論(陳艷)第四節(jié)混合戰(zhàn)略納什均衡有些博弈不存在(純策略的)納什均衡B117設(shè)流浪漢找工作的概率為p,則游蕩為1-p政府的支付:當(dāng)政府救濟(jì),政府得到3p-(1-p)=4p-1當(dāng)政府不救濟(jì),政府得到-p+0=-p流浪漢應(yīng)比較兩種策略:4p-1>-p,p>0.2或者4p-1<-p,p<0.2設(shè)政府救濟(jì)的概率為q,則不救濟(jì)為1-q流浪漢的支付:找工作2q+1-q=q+1游蕩3q+0=3q如果政府打算鼓勵(lì)他找工作,須q+1>3q,q<0.511/24/2022博弈論(陳艷)設(shè)流浪漢找工作的概率為p,則游蕩為1-p10/22/2022118基本概念純戰(zhàn)略:參與人在每一個(gè)給定信息的情況下只選擇一個(gè)特定的行動(dòng)混合戰(zhàn)略:參與人在每一個(gè)給定信息的情況下以某種概率分布隨機(jī)地選擇不同的行動(dòng)純戰(zhàn)略可視為混合戰(zhàn)略的特例“流浪漢”的納什均衡:政府以0.5救濟(jì),流浪漢以0.2找工作11/24/2022博弈論(陳艷)基本概念純戰(zhàn)略:參與人在每一個(gè)給定信息的情況下只選擇一個(gè)特定119一個(gè)參與人使用混合策略的好處是給對(duì)方造成不確定性,渾水摸魚海薩尼對(duì)混合戰(zhàn)略的解釋:混合戰(zhàn)略等價(jià)于不完全信息下的純戰(zhàn)略均衡如稅收檢查,檢查則不偷稅,不檢查則偷稅。但稅務(wù)局檢查有成本,企業(yè)在知道稅務(wù)局可能檢查的情況下,偷稅有風(fēng)險(xiǎn)。此時(shí),可以根據(jù)某些參數(shù)尋找一個(gè)混合策略的納什均衡幾乎所有有限博弈都有有限奇數(shù)個(gè)納什均衡。如果一個(gè)博弈有兩個(gè)純戰(zhàn)略納什均衡,那么,一定存在第三個(gè)混合戰(zhàn)略納什均衡11/24/2022博弈論(陳艷)一個(gè)參與人使用混合策略的好處是給對(duì)方造成不確定性,渾水摸魚11201.4-1混合戰(zhàn)略(mixedstrategies)定義:*=(1*,…,n*)=(i*,-i*)是一納什混合戰(zhàn)略均衡,當(dāng)且僅當(dāng)對(duì)所有參與人而言,i*是-i*的最適反應(yīng),ui(i*,-i*)ui(I’,-i*),對(duì)所有i’i成立)。持混合戰(zhàn)略的前提是在均衡時(shí)兩種戰(zhàn)略的報(bào)酬會(huì)相等,是預(yù)期支付最大化的推導(dǎo)結(jié)果。11/24/2022博弈論(陳艷)1.4-1混合戰(zhàn)略(mixedstrategies)定義:121擲硬幣-1,11,-1反面1,-1-1,1正面反面正面12支付p1-pq1-q參與人1:maxEu=q(p(-1)+(1-p)1)+(1-q)(p1+(1-p)(-1))=-pq+q-pq+p-pq-1+q+p-pq=-4pq+2q+2p-1一階條件為零求得:p=1/211/24/2022博弈論(陳艷)擲硬幣-1,11,-1反面1,-1-1,1正面反面正面12支122擲硬幣的分析給定參與人1(q,1-q),參與人2的支付是:q+(-1)(1-q)(正面)=(-1)q+(1-q)(反面);給定參與人2(p,1-p),參與人1的支付為:p(-1)+(1-p)(正面)=p+(-1)(1-p)(反面);求得(1/2,1/2)是納什混合戰(zhàn)略均衡如果兩種戰(zhàn)略報(bào)酬不相等,那么就變?yōu)榧儜?zhàn)略(purestrategies)了。11/24/2022博弈論(陳艷)擲硬幣的分析給定參與人1(q,1-q),參與人2的支付是:q1231.4-2混合戰(zhàn)略均衡的博弈原則兩博弈方不能讓對(duì)方知道或猜到自己的選擇,因而必須在決策時(shí)利用隨機(jī)性;兩博弈方選擇每種策略的概率一定要恰好使對(duì)方無機(jī)可乘,即讓對(duì)方無法通過針對(duì)性地傾向某一策略而在博弈中占上風(fēng)。例:在擲硬幣的博弈中,參與人1選正面、反面的概率q,1-q,一定要使參與人2選正面的和反面的期望得益相等。11/24/2022博弈論(陳艷)1.4-2混合戰(zhàn)略均衡的博弈原則兩博弈方不能讓對(duì)方知道或猜到124單純戰(zhàn)略與混合戰(zhàn)略的定義G={N,S,U}是一個(gè)戰(zhàn)略式有限博弈,參與人i的戰(zhàn)略空間S中的任一元素si稱為i的一個(gè)單純戰(zhàn)略(purestrategy);定義在Si上的一個(gè)概率分布函數(shù)pi(si)代表了一個(gè)混合戰(zhàn)略(mixedstrategy)——這個(gè)戰(zhàn)略的內(nèi)容是:參與人i以概率pi(sij)選擇單純戰(zhàn)略sij,而pi(sij)=1。單純戰(zhàn)略是混合戰(zhàn)略的特例,因?yàn)槿我粏渭儜?zhàn)略si都可以理解為i以概率1選擇si,以0概率選取其他所有單純戰(zhàn)略。引入混合戰(zhàn)略,參與人的目標(biāo)需要修改為“最大化自己的期望支付”11/24/2022博弈論(陳艷)單純戰(zhàn)略與混合戰(zhàn)略的定義G={N,S,U}是一個(gè)戰(zhàn)略式有限博125Selton:小偷和守衛(wèi)的博弈一小偷欲偷竊有一守衛(wèi)看守的倉庫,如果小偷偷竊時(shí)守衛(wèi)在睡覺,則小偷就能得手,偷得價(jià)值為V的贓物;如果小偷偷竊時(shí)守衛(wèi)沒有睡覺,則小偷就會(huì)被抓住。設(shè)小偷被抓后要坐牢,負(fù)效用為-P,守衛(wèi)睡覺而未遭偷竊有S的正效用,因睡覺被竊要被解雇,其負(fù)效用為-D。而如果小偷不偷,則他既無得也無失,守衛(wèi)不睡意味著出一份力掙一分錢,他也沒有得失。11/24/2022博弈論(陳艷)Selton:小偷和守衛(wèi)的博弈一小偷欲偷竊有一126睡不睡偷V,-D-P,0不偷0,S0,0小偷守衛(wèi)支付小偷與守衛(wèi)的博弈11/24/2022博弈論(陳艷)小偷守衛(wèi)支付小偷與守衛(wèi)的博弈10/22/2022博弈論(陳艷127守衛(wèi)得益(睡)S01pt(小偷偷的概率)pt*pt*/-D-D/小偷的混合策略S到-D連線的縱坐標(biāo)是在橫坐標(biāo)對(duì)應(yīng)的小偷“偷”竊概率下的守衛(wèi)選擇“睡”的期望得益,即S(1-pt)+(-D)pt加重對(duì)守衛(wèi)的處罰在短期中的效果是使守衛(wèi)真正盡職,但在長期中恰恰是會(huì)降低盜竊發(fā)生的概率(激勵(lì)的悖論)11/24/2022博弈論(陳艷)守衛(wèi)得益(睡)S01pt(小偷偷的概率)pt*pt*/-D-128小偷得益(偷)V01Pg(守衛(wèi)睡的概率)Pg*Pg*/-P-P/守衛(wèi)的混合策略小偷的混合策略分布不受P的影響,因此政府加重對(duì)小偷的懲罰在長期中并不能抑制盜竊,最多只能抑制短期的盜竊發(fā)生率,它的作用主要是使守衛(wèi)可以更多地偷懶11/24/2022博弈論(陳艷)小偷得益(偷)V01Pg(守衛(wèi)睡的概率)Pg*Pg*/-P-129齊威王田忌賽馬古代齊威王與大將田忌賽馬,田忌的謀士孫臏運(yùn)用計(jì)謀幫助田忌以弱勝強(qiáng)。比賽規(guī)則:田忌與齊威王各出三匹馬,一對(duì)一比賽三場,每一場的輸方要賠1000斤銅給贏方。雙方的馬按實(shí)力都可以分為上、中、下,但齊威王的上、中、下均優(yōu)于田忌的上、中、下。實(shí)際上,田忌的上馬、中馬要優(yōu)于齊威王的中馬、下馬。比賽結(jié)果:田忌連輸三場;后孫臏建議,以上對(duì)中、以中對(duì)下、以下對(duì)上,結(jié)果以2:1贏得比賽。11/24/2022博弈論(陳艷)齊威王田忌賽馬古代齊威王與大將田忌賽馬,田忌的謀士孫臏運(yùn)用計(jì)130前述為單方面運(yùn)用策略的故事,如果齊威王預(yù)料到田忌的做法,必然會(huì)改變各匹馬出場的次序。本博弈中博弈雙方的利益是完全對(duì)立的,是嚴(yán)格競爭的零和博弈,不會(huì)有純策略納什均衡,必然是一個(gè)混合策略均衡。假設(shè)齊威王采取六種戰(zhàn)略的概率分別為pa,pb,pc,pd,pe,pf(加總為1),則田忌采取六種戰(zhàn)略的期望得益相等,則得出齊威王與田忌均以1/6的相同概率隨機(jī)選擇各自的六個(gè)純策略,構(gòu)成本博弈唯一的混合策略納什均衡。齊威王田忌賽馬11/24/2022博弈論(陳艷)前述為單方面運(yùn)用策略的故事,如果齊威王預(yù)料到田忌的做法,必然131上中下上下中中上下中下上下上中下中上上中下3,-31,-11,-11,-1-1,11,-1上下中1,-
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 常外分班數(shù)學(xué)試卷
- 二零二五年度家居布藝設(shè)計(jì)版權(quán)授權(quán)合同3篇
- 二零二五年度大學(xué)教授科研合作項(xiàng)目合同4篇
- 二零二五年度公共停車場車位投資合同4篇
- 旅游行業(yè)人才培養(yǎng)模式-深度研究
- 二零二四年度智能商鋪?zhàn)赓U合同模板(含品牌入駐協(xié)議)3篇
- 2025年度房地產(chǎn)營銷承包合同范本3篇
- 大氣成分變化研究-深度研究
- 2025年智能停車場車位包銷及運(yùn)營管理合同4篇
- 2025版園林綠化工程苗木采購居間服務(wù)合同3篇
- 保險(xiǎn)專題課件教學(xué)課件
- 牛津上海版小學(xué)英語一年級(jí)上冊(cè)同步練習(xí)試題(全冊(cè))
- 室上性心動(dòng)過速-醫(yī)學(xué)課件
- 建設(shè)工程法規(guī)及相關(guān)知識(shí)試題附答案
- 中小學(xué)心理健康教育課程標(biāo)準(zhǔn)
- 四年級(jí)上冊(cè)脫式計(jì)算400題及答案
- 新課標(biāo)人教版小學(xué)數(shù)學(xué)六年級(jí)下冊(cè)集體備課教學(xué)案全冊(cè)表格式
- 人教精通版三年級(jí)英語上冊(cè)各單元知識(shí)點(diǎn)匯總
- 教案:第三章 公共管理職能(《公共管理學(xué)》課程)
- 諾和關(guān)懷俱樂部對(duì)外介紹
- 保定市縣級(jí)地圖PPT可編輯矢量行政區(qū)劃(河北省)
評(píng)論
0/150
提交評(píng)論