




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、經(jīng)濟(jì)博弈論教材 教學(xué)課件 主編:謝識(shí)予出版:復(fù)旦大學(xué)出版社教材:經(jīng)濟(jì)博弈論(第二版) 復(fù)旦大學(xué)出版社,2002年1月經(jīng)濟(jì)博弈論習(xí)題指南 復(fù)旦大學(xué)出版社,2003年1月第一章 導(dǎo)論 本章介紹博弈論的基本概念,包括什么是博弈和博弈論,給出一些經(jīng)典博弈例子。對(duì)博弈分類和博弈理論的結(jié)構(gòu)作一些討論,對(duì)博弈論的發(fā)展歷史等作簡(jiǎn)單介紹。目標(biāo)是讓讀對(duì)博弈論的內(nèi)容和博弈模型有更直觀的概念和印象,本教材的基本內(nèi)容,以及博弈分析的基本思想方法等形成初步的認(rèn)識(shí),為后面各章展開詳細(xì)分析作好鋪墊和準(zhǔn)備。 本章分五節(jié)1. 1什么是博弈論1. 2幾類經(jīng)典博弈模型1. 3博弈結(jié)構(gòu)和博弈的分類1. 4博弈論歷史和發(fā)展的簡(jiǎn)要評(píng)述1.
2、 5博弈論在我國(guó)的應(yīng)用1.1 什么是博弈論1.1.1 從游戲到博弈1.1.2 一個(gè)非技術(shù)性定義1.1.1 從游戲到博弈博弈就是策略對(duì)抗,或策略有關(guān)鍵作用的游戲博弈Game,博弈論Game Theory,Game即游戲、競(jìng)技游戲和經(jīng)濟(jì)等決策競(jìng)爭(zhēng)較量的共同特征:規(guī)則、結(jié)果、策略選擇,策略和利益相互依存,策略的關(guān)鍵作用 游戲下棋、猜大小 經(jīng)濟(jì)寡頭產(chǎn)量決策、市場(chǎng)阻入、投標(biāo)拍賣 政治、軍事美國(guó)和伊拉克、以色列和巴勒斯坦1.1.2 一個(gè)非技術(shù)性定義定義:博弈就是一些個(gè)人、隊(duì)組或其他組織,面對(duì)一定的環(huán)境條件,在一定的規(guī)則下,同時(shí)或先后,一次或多次,從各自允許選擇的行為或策略中進(jìn)行選擇并加以實(shí)施,各自取得相應(yīng)
3、結(jié)果的過(guò)程。四個(gè)核心方面 博弈的參加者(Player)博弈方 各博弈方的策略(Strategies)或行為(Actions) 博弈的次序(Order) 博弈方的得益(Payoffs)1.2 幾個(gè)經(jīng)典博弈模型1.2.1 囚徒的困境1.2.2 賭勝博弈1.2.3 產(chǎn)量決策的古諾模型1.2.1 囚徒的困境囚徒的困境是圖克(Tucker)1950年提出的該博弈是博弈論最經(jīng)典、著名的博弈該博弈本身講的是一個(gè)法律刑偵或犯罪學(xué)方面的問(wèn)題,但可以擴(kuò)展到許多經(jīng)濟(jì)問(wèn)題,以及各種社會(huì)問(wèn)題,可以揭示市場(chǎng)經(jīng)濟(jì)的根本缺陷一、基本模型-5, -50, -8-8, 0-1, -1坦 白不坦白坦 白不坦白兩個(gè)罪犯的得益矩陣囚徒
4、 2囚徒1囚徒1:坦白囚徒2:坦白二、雙寡頭削價(jià)競(jìng)爭(zhēng)100,10020,105150,2070,70高 價(jià)低 價(jià)高 價(jià)低 價(jià)寡頭2寡頭1雙寡頭的得益矩陣政府組織協(xié)調(diào)的必要性和重要性寡頭1:低價(jià)(70)寡頭2:低價(jià)(70)1.2.2 賭勝博弈賭博、競(jìng)技等構(gòu)成的博弈問(wèn)題,在經(jīng)濟(jì)中也有許多應(yīng)用,賭勝博弈也是一類重要的博弈問(wèn)題,對(duì)經(jīng)濟(jì)競(jìng)爭(zhēng)和合作也有很大啟示賭勝博弈的特點(diǎn)是一方得等于另一方失,不可能雙贏,屬于“零和博弈”一、田忌賽馬3,-31,-11,-11,-1-1,11,-11,-13,-31,-11,-11,-1-1,11,-1-1,13,-31,-11,-11,-1-1,11,-1,1,-13,
5、-31,-11,-11,-11,-11,-1-1,13,-31,-11,-11,-1-1,11,-11,-13,-3上中下上下中中上下中下上下上中下中上上中下上下中中上下中下上下上中下中上田 忌齊威王得益矩陣取勝關(guān)鍵:不讓對(duì)方猜到自己策略,盡可能猜出對(duì)方策略二、猜硬幣博弈-1, 11, -11, -1-1, 1正 面反 面猜硬幣方蓋硬幣方正 面反 面三、石頭、剪子、布0, 01, -1-1, 1-1, 11, -10, 01, -1-1, 10, 0石 頭剪 子布博弈方2石 頭剪 子布博弈方11.2.3 產(chǎn)量決策的古諾模型古諾模型是寡頭產(chǎn)量競(jìng)爭(zhēng),是市場(chǎng)經(jīng)濟(jì)中最常見的問(wèn)題之一古諾1838年提出,
6、直到現(xiàn)在還是經(jīng)常使用古諾模型有很多擴(kuò)展古諾模型與囚徒困境相似,對(duì)理解市場(chǎng)經(jīng)濟(jì)和博弈分析本身都有重要價(jià)值一、三廠商離散產(chǎn)量0P4455376281612856520253056420202455525252543113333333734921213二、n個(gè)廠商連續(xù)產(chǎn)量1.3 博弈結(jié)構(gòu)和博弈分類1.3.1 博弈中的博弈方1.3.2 博弈中的策略1.3.3 博弈中的得益1.3.4 博弈的過(guò)程1.3.5 博弈的信息結(jié)構(gòu)1.3.6 博弈方的能力和理性1.3.7 博弈的分類和博弈理論的結(jié)構(gòu)1.3.1 博弈中的博弈方博弈方:獨(dú)立決策、獨(dú)立承擔(dān)博弈結(jié)果的個(gè)人或組織博弈規(guī)則面前博弈方之間平等,不因博弈方之間權(quán)利
7、、地位的差異而改變博弈方數(shù)量對(duì)博弈結(jié)果和分析有影響根據(jù)博弈方數(shù)量分單人博弈、兩人博弈、多人博弈等。最常見的是兩人博弈,單人博弈是退化的博弈一、單人博弈只有一個(gè)博弈方的博弈例一:?jiǎn)稳嗣詫m入口AB出口(獎(jiǎng)金M)A,1B,1右左右左M00擴(kuò)展形例二:運(yùn)輸路線-7000-16000-10000-10000好天氣(75%)壞天氣(25%)自 然商人水 路陸 路運(yùn)輸路線得益矩陣01-7000-10000-16000-10000運(yùn)輸路線擴(kuò)展形好天氣(75%)壞天氣(25%)單人博弈實(shí)質(zhì)個(gè)體最優(yōu)化問(wèn)題二、兩人博弈兩人博弈即有兩個(gè)博弈方的博弈兩人博弈最常見,研究最多,是最基本和有用的博弈類型囚徒困境、猜硬幣、齊
8、威王田忌賽馬等都是兩人博弈兩人博弈有多種可能性,博弈方的利益方向可能一致,也可以不一致三、多人博弈三個(gè)博弈方之間的博弈可能存在“破壞者”:其策略選擇對(duì)自身的利益并沒(méi)有影響,但卻會(huì)對(duì)其他博弈方的利益產(chǎn)生很大的,有時(shí)甚至是決定性的影響。申辦奧運(yùn)會(huì)是典型例子。多人博弈的表示有時(shí)與兩人博弈不同,需要多個(gè)得益矩陣,或者只能用描述法1.3.2 博弈中的策略策略:博弈中各博弈方的選擇內(nèi)容策略有定性定量、簡(jiǎn)單復(fù)雜之分不同博弈方之間不僅可選策略不同,而且可選策略數(shù)量也可不同有限博弈:每個(gè)博弈方的策略數(shù)都是有限的無(wú)限博弈:至少有某些博弈方的策略有無(wú)限多個(gè)1.3.3 博弈中的得益得益:各博弈方從博弈中所獲得的利益得
9、益對(duì)應(yīng)博弈的結(jié)果,也就是各博弈方策略的組合得益是各博弈方追求的根本目標(biāo)及行為和判斷的主要依據(jù)根據(jù)得益的博弈分類:零和博弈、常和博弈、變和博弈零和博弈:也稱“嚴(yán)格競(jìng)爭(zhēng)博弈”。博弈方之間利益始終對(duì)立,偏好通常不同 猜硬幣,田忌賽馬,石頭-剪刀-布常和博弈:博弈方之間利益的總和為常數(shù)。博弈方之間的利益是對(duì)立的且是競(jìng)爭(zhēng)關(guān)系 分配固定數(shù)額的獎(jiǎng)金、利潤(rùn),遺產(chǎn)官司變和博弈:零和博弈和常和博弈以外的所有博弈。合作利益存在,博弈效率問(wèn)題的重要性。 囚徒困境、產(chǎn)量博弈、制式問(wèn)題等1.3.4 博弈的過(guò)程博弈過(guò)程:博弈方選擇、行為的次序,包括是否多次重復(fù)選擇、行為。博弈過(guò)程對(duì)博弈結(jié)果也有重要影響。根據(jù)博弈的過(guò)程,博弈
10、可分為靜態(tài)博弈、動(dòng)態(tài)博弈、重復(fù)博弈。靜態(tài)博弈:所有博弈方同時(shí)或可看作同時(shí)選擇策略的博弈 田忌賽馬、猜硬幣、古諾模型動(dòng)態(tài)博弈:各博弈方的選擇和行動(dòng)又先后次序且后選擇、后行動(dòng)的博弈方在自己選擇、行動(dòng)之前可以看到其他博弈方的選擇和行動(dòng) 弈棋、市場(chǎng)進(jìn)入、領(lǐng)導(dǎo)追隨型市場(chǎng)結(jié)構(gòu)重復(fù)博弈:同一個(gè)博弈反復(fù)進(jìn)行所構(gòu)成的博弈,提供了實(shí)現(xiàn)更有效略博弈結(jié)果的新可能 長(zhǎng)期客戶、長(zhǎng)期合同、信譽(yù)問(wèn)題有限次重復(fù)博弈無(wú)限次重復(fù)博弈1.3.5 博弈的信息結(jié)構(gòu)完全信息博弈:各博弈方都完全了解所有博弈方各種情況下的得益不完全信息博弈:至少部分博弈方不完全了解其他博弈方得益的情況的博弈,也稱為“不對(duì)稱信息博弈”完美信息博弈:每個(gè)輪到行為
11、的博弈方對(duì)博弈的進(jìn)程完全了解的博弈不完美信息博弈:至少某些博弈方在輪到行動(dòng)時(shí)不完全了解此前全部博弈的進(jìn)程的博弈1.3.6 博弈方的能力和理性完全理性和有限理性完全理性:有完美的分析判斷能力和不會(huì)犯選擇行為的錯(cuò)誤有限理性:博弈方的判斷選擇能力有缺陷個(gè)體理性和集體理性個(gè)體理性:一個(gè)體利益最大為目標(biāo)集體理性:追求集體利益最大化合作博弈:允許存在有約束力協(xié)議的博弈非合作博弈:不允許存在有約束力協(xié)議的博弈1.3.7 博弈的分類和博弈理論的結(jié)構(gòu)非合作博弈和合作博弈非合作博弈范圍內(nèi):完全理性博弈和有限理性博弈(進(jìn)化博弈)靜態(tài)博弈,動(dòng)態(tài)博弈,重復(fù)博弈完全信息靜態(tài)博弈,不完全信息靜態(tài)博弈,完全且完美信息動(dòng)態(tài)博弈
12、,完全但不完美信息動(dòng)態(tài)博弈,不完全信息動(dòng)態(tài)博弈零和博弈和非零和博弈,單人博弈和多人博弈1.4 博弈論歷史和發(fā)展簡(jiǎn)述1.4.1博弈論的早期研究1.4.2博弈論的形成1.4.3博弈論的成長(zhǎng)和發(fā)展1.4.4博弈論的成熟及與主流經(jīng)濟(jì)學(xué)的融合1.4.1博弈論的早期研究博弈論歷史沒(méi)有公認(rèn)答案對(duì)具有策略依存特點(diǎn)決策問(wèn)題的研究可上溯到18世紀(jì)初甚至更早博弈論真正的發(fā)展在本世紀(jì)博弈論總體上仍然是發(fā)展中的學(xué)科 2000年前我國(guó)古代的“齊威王田忌賽馬”1500年前巴比倫猶太教法典“婚姻合同問(wèn)題”等。1838年古諾寡頭模型。1883年伯特蘭德寡頭競(jìng)爭(zhēng)模型。 1913年齊默羅象棋博弈定理 、“逆推歸納法”1921-19
13、27年波雷爾混合策略的第一個(gè)現(xiàn)代表述,有數(shù)種策略兩人博弈的極小化極大解 1928年諾伊曼和摩根斯坦擴(kuò)展形博弈定義,證明有限策略兩人零和博弈有確定結(jié)果 1.4.2博弈論的形成馮.諾伊曼和摩根斯坦博弈論和經(jīng)濟(jì)行為Theory of Games and Economic Behavior 1944引進(jìn)擴(kuò)展形(extensive form)表示和正規(guī)形(normal form)或稱策略形(strategy form)、矩陣形(matrix form)表示提出穩(wěn)定集(stable sets)解概念正式提出創(chuàng)造博弈論一般理論的主意給出博弈論研究的一般框架、概念術(shù)語(yǔ)和表述方法1.4.3 博弈論的成長(zhǎng)和發(fā)展一
14、、第一個(gè)研究高潮,本世紀(jì)40年代末和50年代初1950年納什提出“納什均衡”(Nash equilibrium)概念和證明納什定理,發(fā)展非合作博弈的基礎(chǔ)理論。 1950年Melvin Dresher和Merrill Flood在蘭德公司(美國(guó)空軍)“囚徒的困境”(Prisons dilemma)博弈實(shí)驗(yàn),(Howard Raiffa)獨(dú)立進(jìn)行這個(gè)博弈實(shí)驗(yàn);1952-1953年期間(L. S. Shapley)和(D. B. Gillies)提出“核”(Core)作為合作博弈的一般解概念Shapley提出了合作博弈的“Shapley值”(Shapley value)概念等。奧曼(R. J. Au
15、mann)“40年代末50年代初是博弈論歷史上令人振奮的時(shí)期,原理已經(jīng)破繭而出,正在試飛它們的雙翅,活躍著一批巨人?!?二、50年代中后期一直到70年代博弈論發(fā)展的青年期1954-1955年提出了“微分博弈”(Differential games)的概念。奧曼則在1959年提出了“強(qiáng)均衡”(Strong equilibrium)的概念?!爸貜?fù)博弈”(Repeated games)也是在50年代末開始研究的,這自然引出了關(guān)于重復(fù)博弈的“民間定理”(Folk theorem)。1960年(Thomas C. Schelling)引進(jìn)了“焦點(diǎn)”(Focal point)的概念。博弈論在進(jìn)化生物學(xué)(E
16、volutionary Biology)中的公開應(yīng)用也是在60年代初出現(xiàn)的。 塞爾騰(Selten)1965提出“子博弈完美納什均衡”(subgame perfect Nash equilibrium)1975年提出的“顫抖手均衡”(Trembling hand perfect equilibrium)海薩尼(Harsanyi)1967-1968三篇構(gòu)造不完全信息博弈理論的系列論文,“貝葉斯納什均衡”(Bayesian Nash equilibrium)。海薩尼1973年提出關(guān)于“混合策略”的不完全信息解釋,以及“嚴(yán)格納什均衡”(Strict Nash equilibrium)。70年代“進(jìn)化
17、博弈論”(Evolutionary game theory)的重要發(fā)展,(John Maynard Smith)1972年引進(jìn)“進(jìn)化穩(wěn)定策略”( Evolutionarily stable strategy,ESS)等?!肮餐R(shí)”(Common knowledge)的重要性,因?yàn)閵W曼1976年的文章引起廣泛的重視。 三、40年代末到70年代末是博弈論發(fā)展的重要階段這個(gè)時(shí)期博弈理論仍然沒(méi)有成熟,理論體系還比較亂,概念和分析方法很不統(tǒng)一,在經(jīng)濟(jì)學(xué)中的作用和影響還比較有限,但這個(gè)時(shí)期博弈論研究的繁榮和進(jìn)展卻是非常顯著的。對(duì)這一階段博弈論研究的迅速發(fā)展,除了理論發(fā)展自身規(guī)律的作用以外,全球政治、軍事
18、、經(jīng)濟(jì)特定環(huán)境條件的影響(戰(zhàn)爭(zhēng)和冷戰(zhàn)時(shí)期的軍事對(duì)抗和威懾策略研究的需要,經(jīng)濟(jì)競(jìng)爭(zhēng)、國(guó)際經(jīng)濟(jì)競(jìng)爭(zhēng)的加?。?,以及經(jīng)濟(jì)學(xué)理論發(fā)展本身的需要等,都起了重要的作用。正是因?yàn)橛辛诉@一階段博弈論研究的繁榮發(fā)展,才有80、90年代博弈論的成熟和對(duì)經(jīng)濟(jì)學(xué)的博弈論革命。 1.4.4博弈論的成熟及與主流經(jīng)濟(jì)學(xué)的融合一、80、90年代是博弈論走向成熟的時(shí)期 1981(Elon Kohlberg) “順推歸納法”(Forward induction)克瑞潑斯(David M. kreps)和威爾孫(Robert Wilson)1982年提出“序列均衡”(Sequential equilibria)1982年斯密(Joh
19、n Maynard Smith)出版了進(jìn)化和博弈論()1984年由伯恩海姆(B. D. Bernheim)和皮爾斯(D. G. Pearce)提出“可理性化性”(Rationalizability)海薩尼和塞爾騰1988年提出了在非合作和合作博弈中均衡選擇的一般理論和標(biāo)準(zhǔn),1991年弗得伯格(D. Fudenberg)和泰勒爾(J. Tirole)首先提出了“完美貝葉斯均衡”(Perfext Bayesian equilibrium)的概念二、博弈論和經(jīng)濟(jì)學(xué)諾貝爾獎(jiǎng)1994:非合作博弈:納什(Nash)、海薩尼(Harsanyi)、塞爾頓(Selten)1996:不對(duì)稱信息激勵(lì)理論:莫里斯(M
20、irrlees)和維克瑞(Vickrey)2001:不完全信息市場(chǎng)博弈:阿克羅夫(Akerlof)(商品市場(chǎng))、斯潘塞(Spence)(教育市場(chǎng))、斯蒂格里茲(Stiglitze)(保險(xiǎn)市場(chǎng))2002:實(shí)驗(yàn)經(jīng)濟(jì)學(xué):史密斯(Smith),心理經(jīng)濟(jì)學(xué):卡尼曼(Kahneman)1.5 博弈論在我國(guó)的應(yīng)用企業(yè)經(jīng)營(yíng)者的決策思路和工具。政府的政策和管理思路,與個(gè)人、企業(yè)和地方博弈的意識(shí)。社會(huì)經(jīng)濟(jì)問(wèn)題的理論分析工具,解釋經(jīng)濟(jì)中許多低效率現(xiàn)象的根源,找出各種經(jīng)濟(jì)問(wèn)題的制度性、環(huán)境性原因,揭示各種經(jīng)濟(jì)行為和政策的效率意義等。第二章 完全信息靜態(tài)博弈 本章介紹完全信息靜態(tài)博弈。完全信息靜態(tài)博弈即各博弈方同時(shí)決策
21、,且所有博弈方對(duì)各方得益都了解的博弈。囚徒的困境、齊威王田忌賽馬、猜硬幣、石頭剪子布、古諾產(chǎn)量決策都屬于這種博弈。完全信息靜態(tài)博弈屬于非合作博弈最基本的類型。本章介紹完全信息靜態(tài)博弈的一般分析方法、納什均衡概念、各種經(jīng)典模型及其應(yīng)用等。 本章分六節(jié)2.1基本分析思路和方法2.2納什均衡2.3無(wú)限策略博弈分析和反應(yīng)函數(shù)2.4混合策略和混合策略納什均衡2.5納什均衡的存在性2.6納什均衡的選擇和分析方法擴(kuò)展2.1 基本分析思路和方法2.1.1 上策均衡2.1.2 嚴(yán)格下策反復(fù)消去法2.1.3 劃線法2.1.4 箭頭法2.1.1 上策均衡上策:不管其它博弈方選擇什么策略,一博弈方的某個(gè)策略給他帶來(lái)的
22、得益始終高于其它的策略,至少不低于其他策略的策略 囚徒的困境中的“坦白”;雙寡頭削價(jià)中“低價(jià)”。上策均衡:一個(gè)博弈的某個(gè)策略組合中的所有策略都是各個(gè)博弈方各自的上策,必然是該博弈比較穩(wěn)定的結(jié)果上策均衡不是普遍存在的 2.1.2 嚴(yán)格下策反復(fù)消去法嚴(yán)格下策:不管其它博弈方的策略如何變化,給一個(gè)博弈方帶來(lái)的收益總是比另一種策略給他帶來(lái)的收益小的策略嚴(yán)格下策反復(fù)消去:1,01,30,10,40,22,0左中右上下1,01,30,40,2左中1,01,3左中2.1.3 劃線法1, 01, 30, 10, 40, 22, 0-5, -50, -8-8, 0-1, -1囚徒困境-1, 11, -11, -
23、1-1, 1猜硬幣2, 10, 00, 01, 3夫妻之爭(zhēng)2.1.4 箭頭法1, 01, 30, 10, 40, 22, 0-5, -50, -8-8, 0-1, -1囚徒困境-1, 11, -11, -1-1, 1猜硬幣2, 10, 00, 01, 3夫妻之爭(zhēng)2.2 納什均衡2.2.1 納什均衡的定義2.2.2 納什均衡的一致預(yù)測(cè)性質(zhì)2.2.3 納什均衡與嚴(yán)格下策反復(fù)消去法2.2.1 納什均衡的定義策略空間:博弈方 的第 個(gè)策略:博弈方 的得益:博弈:納什均衡:在博弈 中,如果由各個(gè)博弈方的各一個(gè)策略組成的某個(gè)策略組合 中,任一博弈方 的策略,都是對(duì)其余博弈方策略的組合 的最佳對(duì)策,也即 對(duì)
24、任意 都成立,則稱 為 的一個(gè)納什均衡2.2.2 納什均衡的一致預(yù)測(cè)性質(zhì)一致預(yù)測(cè):如果所有博弈方都預(yù)測(cè)一個(gè)特定博弈結(jié)果會(huì)出現(xiàn),所有博弈方都不會(huì)利用該預(yù)測(cè)或者這種預(yù)測(cè)能力選擇與預(yù)測(cè)結(jié)果不一致的策略,即沒(méi)有哪個(gè)博弈方有偏離這個(gè)預(yù)測(cè)結(jié)果的愿望,因此預(yù)測(cè)結(jié)果會(huì)成為博弈的最終結(jié)果只有納什均衡才具有一致預(yù)測(cè)的性質(zhì)一致預(yù)測(cè)性是納什均衡的本質(zhì)屬性一致預(yù)測(cè)并不意味著一定能準(zhǔn)確預(yù)測(cè),因?yàn)橛卸嘀鼐猓A(yù)測(cè)不一致的可能2.2.3 納什均衡與嚴(yán)格下策反復(fù)消去法上策均衡肯定是納什均衡,但納什均衡不一定是上策均衡命題2.1:在n個(gè)博弈方的博弈 中,如果嚴(yán)格下策反復(fù)消去法排除了除 之外的所有策略組合,那么 一定是該博弈的唯一
25、的納什均衡命題2.2:在n個(gè)博弈方的博弈中 中,如果 是 的一個(gè)納什均衡,那么嚴(yán)格下策反復(fù)消去法一定不會(huì)將它消去 上述兩個(gè)命題保證在進(jìn)行納什均衡分析之前先通過(guò)嚴(yán)格下策反復(fù)消去法簡(jiǎn)化博弈是可行的2.3 無(wú)限策略分析和反應(yīng)函數(shù)2.3.1 古諾的寡頭模型2.3.2 反應(yīng)函數(shù)2.3.3 伯特蘭德寡頭模型2.3.4 公共資源問(wèn)題2.3.5 反應(yīng)函數(shù)的問(wèn)題和局限性2.3.1 古諾的寡頭模型寡頭產(chǎn)量競(jìng)爭(zhēng)以兩廠商產(chǎn)量競(jìng)爭(zhēng)為例222126qqqq-=4.5,4.55,3.753.75,54,4不突破突破廠商2不突破 突破廠商1以自身最大利益為目標(biāo):各生產(chǎn)2單位產(chǎn)量,各自得益為4以兩廠商總體利益最大:各生產(chǎn)1.5
26、單位產(chǎn)量,各自得益為4.5兩寡頭間的囚徒困境博弈2.3.2 反應(yīng)函數(shù)古諾模型的反應(yīng)函數(shù)(3,0)(6,0)(0,3)(0,6)古諾模型的反應(yīng)函數(shù)圖示理性局限和古諾調(diào)整2.3.3 伯特蘭德寡頭模型價(jià)格競(jìng)爭(zhēng)寡頭的博弈模型產(chǎn)品無(wú)差別,消費(fèi)者對(duì)價(jià)格不十分敏感2.3.4 公共資源問(wèn)題公共草地養(yǎng)羊問(wèn)題以三農(nóng)戶為例 n=3,c=4合作:總體利益最大化競(jìng)爭(zhēng):個(gè)體利益最大化2.3.5 反應(yīng)函數(shù)的問(wèn)題和局限性在許多博弈中,博弈方的策略是有限且非連續(xù)時(shí),其得益函數(shù)不是連續(xù)可導(dǎo)函數(shù),無(wú)法求得反應(yīng)函數(shù),從而不能通過(guò)解方程組的方法求得納什均衡。即使得益函數(shù)可以求導(dǎo),也可能各博弈方的得益函數(shù)比較復(fù)雜,因此各自的反應(yīng)函數(shù)也比
27、較復(fù)雜,并不總能保證各博弈方的反應(yīng)函數(shù)有交點(diǎn),特別不能保證有唯一的交點(diǎn)。2.4 混合策略和混合策略納什均衡2.4.1 嚴(yán)格競(jìng)爭(zhēng)博弈和混合策略的引進(jìn)2.4.2 多重均衡博弈和混合策略2.4.3 混合策略和嚴(yán)格下策反復(fù)消去法2.4.4 混合策略反應(yīng)函數(shù)2.4.1 嚴(yán)格競(jìng)爭(zhēng)博弈和混合策略的引進(jìn)一、猜硬幣博弈-1, 11, -11, -1-1, 1正 面反 面猜硬幣方蓋硬幣方正 面反 面(1)不存在前面定義的納什均衡策略組合(2)關(guān)鍵是不能讓對(duì)方猜到自己策略這類博弈很多,引出混合策略納什均衡概念二、混合策略、混合策略博弈 和混合策略納什均衡 混合策略:在博弈 中,博弈方 的策略空間為 ,則博弈方 以概
28、率分布 隨機(jī)在其 個(gè)可選策略中選擇的“策略”,稱為一個(gè)“混合策略”,其中 對(duì) 都成立,且 混合策略擴(kuò)展博弈:博弈方在混合策略的策略空間(概率分布空間)的選擇看作一個(gè)博弈,就是原博弈的“混合策略擴(kuò)展博弈)。 混合策略納什均衡:包含混合策略的策略組合,構(gòu)成納什均衡。三、一個(gè)例子該博弈無(wú)純策略納什均衡,可用混合策略納什均衡分析博弈方1的混合策略博弈方2的混合策略2, 35, 23, 11, 5CDAB博弈方2博弈方1 策略 得益博弈方1 (0.8,0.2) 2.6博弈方2 (0.8,0.2) 2.6四、齊威王田忌賽馬3,-31,-11,-11,-1-1,11,-11,-13,-31,-11,-11,
29、-1-1,11,-1-1,13,-31,-11,-11,-1-1,1 1,-11,-13,-31,-11,-11,-11,-11,-1-1,13,-31,-11,-11,-1-1,11,-11,-13,-3上中下上中下上中下上中下上中下上中下上中下上中下上中下上中下上中下上中下田 忌齊威王得益矩陣五、小偷和守衛(wèi)的博弈V,-D-P,00,S0,0睡不睡偷不偷守衛(wèi)小偷加重對(duì)首位的處罰:短期中的效果是使守衛(wèi)真正盡職在長(zhǎng)期中并不能使守衛(wèi)更盡職,但會(huì)降低盜竊發(fā)生的概略0- D- D守衛(wèi)得益(睡)SPt 小偷偷的概率1V,-D-P,00,S0,0睡不睡偷不偷守衛(wèi)小偷加重對(duì)小偷的處罰:短期內(nèi)能抑制盜竊發(fā)生率
30、長(zhǎng)期并不能降低盜竊發(fā)生率,但會(huì)是的守衛(wèi)更多的偷懶0- P- P小偷得益(偷)VPg 守衛(wèi)睡的概略12.4.2 多重均衡博弈和混合策略一、夫妻之爭(zhēng)的混合策略納什均衡2, 10, 00, 01, 3時(shí) 裝足 球時(shí)裝足球丈 夫妻子夫妻之爭(zhēng)妻子的混合策略丈夫的混合策略夫妻之爭(zhēng)博弈的混合策略納什均衡 策略 得益博弈方1 (0.75,0.25) 0.67博弈方2 (1/3,2/3) 0.75二、制式問(wèn)題1, 30, 00, 02, 2ABAB廠商2廠商1制式問(wèn)題 制式問(wèn)題混合策略納什均衡 A B 得益廠商1: 0.4 0.6 0.664廠商2: 0.67 0.33 1.296三、市場(chǎng)機(jī)會(huì)博弈-50,-50
31、100,00,1000,0進(jìn)不 進(jìn)進(jìn)不進(jìn)廠商2廠商1市場(chǎng)機(jī)會(huì) 進(jìn) 不進(jìn) 得益廠商1: 2/3 1/3 0廠商2: 2/3 1/3 02.4.3 混合策略和嚴(yán)格下策反復(fù)消去法3, 10, 20, 23, 31, 31, 1LRUMD博弈方2博弈方1博弈方2采用純策略L時(shí),博弈方1采用混合策略(1/2,1/2,0)的得益博弈方2采用純策略R時(shí),博弈方1采用混合策略(1/2,1/2,0)的得益2.4.4 混合策略反應(yīng)函數(shù)猜硬幣博弈-1, 11, -11, -1-1, 1正 面反 面猜硬幣方正面反面猜硬幣博弈蓋硬幣方rq111/21/2(r,1-r):蓋硬幣方選擇正反面的混合策略概率分布(q,1-q)
32、:猜硬幣方選擇正反面的混合策略概率分布夫妻之爭(zhēng)博弈2, 10, 00, 01, 3時(shí)裝足球丈夫時(shí)裝足球妻子夫妻之爭(zhēng)rq111/31/3(r,1-r):丈夫的混合策略概率分布(q,1-q):妻子的混合策略概率分布2.5 納什均衡的存在性納什定理:在一個(gè)由n個(gè)博弈方的博弈 中,如果n是有限的,且 都是有限集(對(duì) ),則該博弈至少存在一個(gè)納什均衡,但可能包含混合策略。教材106頁(yè)證明。主要根據(jù)是布魯威爾和角谷的不動(dòng)點(diǎn)定理。納什均衡的普遍存在性正是納什均衡成為非合作博弈分析核心概念的根本原因之一。2.6 納什均衡的選擇和分析方法擴(kuò)展2.6.1 多重納什均衡博弈的分析2.6.2 共謀和防共謀均衡2.6.
33、1 多重納什均衡博弈的分析帕累托上策均衡風(fēng)險(xiǎn)上策均衡聚點(diǎn)均衡相關(guān)均衡一、帕累托上策均衡(鷹鴿博弈)這個(gè)博弈中有兩個(gè)純策略納什均衡,(戰(zhàn)爭(zhēng),戰(zhàn)爭(zhēng))和(和平,和平),顯然后者帕累托優(yōu)于前者,所以,(和平,和平)是本博弈的一個(gè)帕累托上策均衡。-5, -5-10, 88, -1010, 10戰(zhàn)爭(zhēng)和平國(guó)家2戰(zhàn)爭(zhēng)和平國(guó)家1戰(zhàn)爭(zhēng)與和平二、風(fēng)險(xiǎn)上策均衡 考慮、顧忌博弈方、其他博弈方可能發(fā)生錯(cuò)誤等時(shí),帕累托上策均衡并不一定是最優(yōu)選擇,需要考慮:風(fēng)險(xiǎn)上策均衡。下面就是兩個(gè)例子。9, 98, 00, 87, 7LR博弈方2UD博弈方1風(fēng)險(xiǎn)上策均衡(D,R)5, 53, 00, 33, 3鹿兔子獵人2鹿兔子獵人1獵鹿
34、博弈風(fēng)險(xiǎn)上策均衡(兔子,兔子)三、聚點(diǎn)均衡利用博弈設(shè)定以外的信息和依據(jù)選擇的均衡文化、習(xí)慣或者其他各種特征都可能是聚點(diǎn)均衡的依據(jù)城市博弈(城市分組相同)、時(shí)間博弈(報(bào)出相同的時(shí)間)是聚點(diǎn)均衡的典型例子四、相關(guān)均衡5, 14, 40, 01, 5LR博弈方2UD博弈方1相關(guān)均衡例子三個(gè)納什均衡:(U,L)、(D,R)和混合策略均衡(1/2,1/2),(1/2,1/2)結(jié)果都不理想,不如(D,L)??衫镁埸c(diǎn)均衡(天氣,拋硬幣),但仍不理想。相關(guān)裝置:1、各1/3概率A、B、C2、博弈方1看到是否A,博弈方2看到是否C3、博弈方1見A采用U,否則D;博弈方2見C采用R,否則L。相關(guān)均衡要點(diǎn):1、構(gòu)
35、成納什均衡2、有人忽略不造成問(wèn)題一、多人博弈中的共謀問(wèn)題本博弈的純策略納什均衡:(U,L,A)、(D,R,B) 前者帕累托優(yōu)于后者。博弈的結(jié)果會(huì)是什么呢?(U,L,A)有共謀 (Coalition)問(wèn)題:博弈方1和2同時(shí)偏離。0,0,10-5,-5,0-5,-5,01,1,-5LRUD博弈方2博弈方1博弈方3A-2,-2,0-5,-5,0-5,-5,0-1,-1,5LRUD博弈方2博弈方1博弈方3B2.6.2 共謀和防共謀均衡二、防共謀均衡 如果一個(gè)博弈的某個(gè)策略組合滿足下列要求:(1)沒(méi)有任何單個(gè)博弈方的“串通”會(huì)改變博弈的結(jié)果,即單獨(dú)改變策略無(wú)利可圖;(2)給定選擇偏離的博弈方有再次偏離的
36、自由時(shí),沒(méi)有任何兩個(gè)博弈方的串通會(huì)改變博弈的結(jié)果;(3)依此類推,直到所有博弈方都參加的串通也不會(huì)改變博弈的結(jié)果。 稱為“防共謀均衡”。前面例子中:(D,R,B) 是防共謀均衡 (U,L,A)不是防共謀均衡第三章 完全且完美信息動(dòng)態(tài)博弈 本章討論動(dòng)態(tài)博弈,所有博弈方都對(duì)博弈過(guò)程和得益完全了解的完全且完美信息動(dòng)態(tài)博弈。這類博弈也是現(xiàn)實(shí)中常見的基本博弈類型。由于動(dòng)態(tài)博弈中博弈方的選擇、行為有先后次序,因此在表示方法、利益關(guān)系、分析方法和均衡概念等方面,都與靜態(tài)博弈有很大區(qū)別。本章對(duì)動(dòng)態(tài)博弈分析的概念和方法,特別是子博弈完美均衡和逆推歸納法作系統(tǒng)介紹,并介紹各種經(jīng)典的動(dòng)態(tài)博弈模型。本章分六節(jié)3.1動(dòng)
37、態(tài)博弈的表示法和特點(diǎn)3.2可信性和納什均衡的問(wèn)題3.3子博弈和子博弈完美納什均衡3.4幾個(gè)經(jīng)典動(dòng)態(tài)博弈模型3.5有同時(shí)選擇的動(dòng)態(tài)博弈模型3.6動(dòng)態(tài)博弈分析的問(wèn)題和擴(kuò)展討論3.1 動(dòng)態(tài)博弈的表示法和特點(diǎn)3.1.1 階段和擴(kuò)展性表示3.1.2 動(dòng)態(tài)博弈的基本特點(diǎn)3.1.1 階段和擴(kuò)展性表示階段:動(dòng)態(tài)博弈中一個(gè)博弈方的一次選擇行為例子:仿冒和反仿冒博弈ABBA不制止制止(-2,5)(2,2)(10,4)(5,5)不仿冒(0,10)仿冒不制止制止仿冒不仿冒3.1.2 動(dòng)態(tài)博弈的基本特點(diǎn)策略是在整個(gè)博弈中所有選擇、行為的計(jì)劃結(jié)果是上述“計(jì)劃型”策略的策略組合,構(gòu)成一條路徑得益對(duì)應(yīng)每條路徑,而不是對(duì)應(yīng)每步
38、選擇、行為動(dòng)態(tài)博弈的非對(duì)稱性先后次序決定動(dòng)態(tài)博弈必然是非對(duì)稱的。先選擇、行為的博弈方常常更有利,有“先行優(yōu)勢(shì)”。3.2 可信性和納什均衡的問(wèn)題3.2.1 相機(jī)選擇和策略中的可信性問(wèn)題3.2.2 納什均衡的問(wèn)題3.2.3 逆推歸納法3.2.1 相機(jī)選擇和策略中的可信性問(wèn)題不同版本的開金礦博弈分錢和打官司的可信性乙甲(0,4)(2,2)(1,0)不借借分不分開金礦博弈不借乙甲乙借不分分(1,0)不打打(0,4)(1,0)(2,2)有法律保障的開金礦博弈分錢打官司都可信乙甲乙打(2,2)不分分不借借(0,4)(-1,0)不打(1,0)法律保障不足的開金礦博弈分錢打官司都不可信3.2.2 納什均衡的問(wèn)
39、題 第三種開金礦博弈中, (不借-不打,不分)和(借-打,分)都是納什均衡。但后者不可信,不可能實(shí)現(xiàn)或穩(wěn)定。結(jié)論:納什均衡在動(dòng)態(tài)博弈可能缺乏穩(wěn)定性,也就是說(shuō),在完全信息靜態(tài)博弈中穩(wěn)定的納什均衡,在動(dòng)態(tài)博弈中可能是不穩(wěn)定的,不能作為預(yù)測(cè)的基礎(chǔ)。根源:納什均衡本身不能排除博弈方策略中包含的不可信的行為設(shè)定,不能解決動(dòng)態(tài)博弈的相機(jī)選擇引起的可信性問(wèn)題3.2.3 逆推歸納法定義:從動(dòng)態(tài)博弈的最后一個(gè)階段博弈方的行為開始分析,逐步倒推回前一個(gè)階段相應(yīng)博弈方的行為選擇,一直到第一個(gè)階段的分析方法,稱為“逆推歸納法”。逆推歸納法是動(dòng)態(tài)博弈分析最重要、基本的方法。乙不借借(1,0)甲不分分(0,4)(2,2)
40、3.3 子博弈和子博弈完美納什均衡3.3.1 子博弈3.3.2 子博弈完美納什均衡3.3.1 子博弈定義:由一個(gè)動(dòng)態(tài)博弈第一階段以外的某階段開始的后續(xù)博弈階段構(gòu)成的,有初始信息集和進(jìn)行博弈所需要的全部信息,能夠自成一個(gè)博弈的原博弈的一部分,稱為原動(dòng)態(tài)博弈的一個(gè)“子博弈”。乙甲不借借不分分(1,0)(0,4)(2,2)乙(-1,0)3.3.2 子博弈完美納什均衡定義:如果一個(gè)完美信息的動(dòng)態(tài)博弈中,各博弈方的策略構(gòu)成的一個(gè)策略組合滿足,在整個(gè)動(dòng)態(tài)博弈及它的所有子博弈中都構(gòu)成納什均衡,那么這個(gè)策略組合稱為該動(dòng)態(tài)博弈的一個(gè)“子博弈完美納什均衡”。子博弈完美納什均衡能夠排除均衡策略中不可信的威脅和承諾,
41、因此是真正穩(wěn)定的。逆推歸納法是求完美信息動(dòng)態(tài)博弈子博弈完美納什均衡的基本方法。3.4 幾個(gè)經(jīng)典動(dòng)態(tài)博弈模型3.4.1 寡占的斯塔克博格模型3.4.2 勞資博弈3.4.3 討價(jià)還價(jià)博弈3.4.4 委托人代理人理論3.4.1 寡占的斯塔克博格模型先后選擇產(chǎn)量的產(chǎn)量競(jìng)爭(zhēng)博弈把古諾模型改為廠商1先選擇,廠商2后選擇,而非同時(shí)選擇即可。222126qqqq-= 產(chǎn)量 得益廠商1 3單位 4.5廠商2 1.5單位 2.25先行優(yōu)勢(shì)3.4.2 勞資博弈先由工會(huì)決定工資率,再由廠商決定雇用多少勞動(dòng)力RL0W L廠商的反應(yīng)函數(shù)R(L)斜率為WLW0工會(huì)的誤差異曲線3.4.3 討價(jià)還價(jià)博弈三回合討價(jià)還價(jià)112不接
42、受,出S接受不接受,出S2接受出S1三回合討價(jià)還價(jià)博弈結(jié)果的討論無(wú)限回合討價(jià)還價(jià)3.4.4 委托人代理人理論一、委托人代理人關(guān)系經(jīng)濟(jì)活動(dòng)和社會(huì)活動(dòng)中有很多委托人代理人關(guān)系,有明顯的,也有隱蔽的。工廠和工人、店主和店員、客戶和律師、市民和政府、基金購(gòu)買者和基金管理人等都是。委托人代理人關(guān)系的關(guān)鍵特征:不能直接控制,監(jiān)督不完全,信息不完全,利益的相關(guān)性委托人代理人涉及問(wèn)題:激勵(lì)機(jī)制設(shè)計(jì)、機(jī)制設(shè)計(jì)理論,委托合同設(shè)計(jì)問(wèn)題等二、無(wú)不確定性的委托人代理人模型R(S)-w(S), w(S)-SR(E)-w(E), w(E)-ER(0),0R(0),0122偷懶努力拒絕接受不委托委托代理人的選擇激勵(lì)相容約束:
43、 w(E)-E w(S)-S w(E) w(S)+E-S參與約束:22R(E)-w(E), w(E)-E拒絕接受拒絕接受R(0),0R(S)-w(S), w(S)-SR(0),0接受:w(E)-E0接受:w(S)-S0參與約束委托人的選擇11不委托委托委托R(S)-w(S), w(S)-SR(0),0R(E)-w(E), w(E)-E不委托R(0),0委托: R(E)-w(E) R(0)不委托: R(E)-w(E) R(0)不委托: R(S)-w(S) 0不委托: 0.1*20-w(S) +0.9*10-w(S)0不委托:0.9*20-w(E)+0.1*10-w(E)0.1*w(20)-S+0
44、.9*w(10-S)接受:0.9*w(20)-E+0.1*w(10)-E0委托:0.9*20-w(20)+0.1*10-w(10)0激勵(lì)相容約束促使代理人努力的激勵(lì)相容約束、參與約束,以及委托人選擇委托的條件參與約束對(duì)于委托人來(lái)說(shuō),就是要根據(jù)上述兩個(gè)條件,以及 E、S的值,選擇最佳的工資水平w(20)和w(10),或者它們的差額w(20) -w(10)五、選擇報(bào)酬和連續(xù)努力水平的 委托人代理人博弈R, CC(e) +R(e)委托人希望的代理人努力水平(滿足參與約束)店主和店員的問(wèn)題商店的利潤(rùn) , 是均值為0的隨機(jī)變量店員的負(fù)效用 , 是店員的努力機(jī)會(huì)成本為1店主采用的報(bào)酬計(jì)算公式店員的得益店員
45、期望得益為店主的得益為參與約束:當(dāng)?shù)陠T風(fēng)險(xiǎn)中性時(shí) 符合其最大利益店主選擇下限 代入得益公式得: ,期望得益為 ,易求得令 得 ,再代入?yún)⑴c約束得 ,求數(shù)學(xué)期望得 解得 ,則店主的最優(yōu)激勵(lì)工資計(jì)算公式是3.5 有同時(shí)選擇的動(dòng)態(tài)博弈模型3.5.1 標(biāo)準(zhǔn)模型3.5.2 間接融資和擠兌風(fēng)險(xiǎn)3.5.3 國(guó)際競(jìng)爭(zhēng)和最優(yōu)關(guān)稅3.5.4 工資獎(jiǎng)金制度3.5.1 標(biāo)準(zhǔn)模型博弈中有四個(gè)博弈方,分別稱為博弈方1、博弈方2、博弈方3和博弈方4第一階段是博弈方1和博弈方2的選擇階段,他們同時(shí)在各自的可選策略(行為)集合 和 中分別選擇 和 第二階段是博弈方3和博弈方4的選擇階段,他們?cè)诳吹讲┺姆?和博弈方2的選擇 和
46、以后,同時(shí)在各自的可選策略(行為)集合 和 中分別選擇 和各博弈方的得益都取決于所有博弈方的策略 即博弈方i的得益是各個(gè)博弈方所選擇策略的多元函數(shù)3.5.2 間接融資和擠兌風(fēng)險(xiǎn)下一階段1, 11, 11, 1不 存存 款客戶2不存存款客戶1第一階段0.8,0.80.6,11,0.61.2,1.2提 前到 期客戶2提前到期客戶1第二階段(到期,到期) (存款,存款)(提前,提前) (不存,不存)1.2,1.2第二階段建立信貸保證、保險(xiǎn)制度,對(duì)存款進(jìn)行保護(hù)、保險(xiǎn)的原因非法集資問(wèn)題 現(xiàn)代更容易引發(fā)金融、社會(huì)風(fēng)險(xiǎn)的主要是不正規(guī)的非法金融活動(dòng),如地下錢莊和非法集資等。因?yàn)榉欠ń鹑诨顒?dòng)常常通過(guò)惡意欺騙的手
47、段吸引人們參加,用借新債還舊債的方法,而不是經(jīng)營(yíng)利潤(rùn)償還到期資金,信用差、管理差而且缺乏保險(xiǎn)措施,引起金融風(fēng)險(xiǎn)并引發(fā)社會(huì)問(wèn)題的可能性要大得多。3.5.3 國(guó)際競(jìng)爭(zhēng)和最優(yōu)關(guān)稅廠商的得益函數(shù)為:第二階段廠商選擇:第一階段政府選擇:先把第二階段根據(jù)廠商選擇得到結(jié)果代入政府得益,再求最優(yōu)化:政府的得益函數(shù);3.5.4 工資獎(jiǎng)金制度 模型假設(shè):1.雇員i(i=1,2)的產(chǎn)出函數(shù)為 , 為雇員努力水平, 為隨機(jī)擾動(dòng)。 服從分布密度 ,均值為0的隨機(jī)變量。 雇員努力的負(fù)效用函數(shù)為 ,且 。2.產(chǎn)量高的雇員得到高工資 ,產(chǎn)量低的得到低工資 。3.兩雇員在已知雇主宣布的工資獎(jiǎng)金制度下,同時(shí)獨(dú)立選擇各自的努力程度
48、。雇員選擇雇主決定了工資以后,雇員同時(shí)決定努力程度:一階條件這是雇員所選擇努力程度必須滿足的基本條件。利用條件概率的貝葉斯法則: 代入得: 兩雇員情況一樣,對(duì)努力程度的選擇也相同,即: ,這樣就得到: 這就是兩雇員之間的靜態(tài)博弈納什均衡。 若進(jìn)一步假設(shè) ,那么雇主選擇 由于雇員之間博弈的均衡是對(duì)稱均衡,因此雙方贏得競(jìng)賽的機(jī)會(huì)都是0.5,假設(shè)雇能得到其他工作機(jī)會(huì)提供的得益是 ,則保證雇員接受工作的基本條件是:此即“參與約束”。 由于在雇員接受工作的前提下,雇主必然盡可能壓低工資,因此約束條件可取等號(hào): 于是得到: 設(shè)上述參與約束條件滿足,雇主的利潤(rùn)函數(shù)為 雇主的期望利潤(rùn)為 ,因此雇主有如下的最優(yōu)
49、化問(wèn)題:上述雇主決策可轉(zhuǎn)化為促使雇員的努力程度滿足: 一階條件為: 代入兩雇員的最優(yōu)努力水平?jīng)Q定公式得到:3.6 動(dòng)態(tài)博弈分析的問(wèn)題和擴(kuò)展討論3.6.1 逆推歸納法的問(wèn)題3.6.2 顫抖手均衡和順推歸納法3.6.3 蜈蚣博弈問(wèn)題3.6.1 逆推歸納法的問(wèn)題逆推歸納法只能分析明確設(shè)定的博弈問(wèn)題,要求博弈的結(jié)構(gòu),包括次序、規(guī)則和得益情況等都非常清楚,并且各個(gè)博弈方了解博弈結(jié)構(gòu),相互知道對(duì)方了解博弈結(jié)構(gòu)。這些可能有脫實(shí)際的可能逆推歸納法也不能分析比較復(fù)雜的動(dòng)態(tài)博弈在遇到兩條路徑利益相同的情況時(shí)逆推歸納法也會(huì)發(fā)生選擇困難對(duì)博弈方的理性要求太高,不僅要求所有博弈方都有高度的理性,不允許犯任何錯(cuò)誤,而且要
50、求所有博弈方相互了解和信任對(duì)方的理性,對(duì)理性有相同的理解,或進(jìn)一步有“理性的共同知識(shí)”3.6.2 顫抖手均衡和順推歸納法顫抖手均衡10, 010, 12, 06, 2LRUD博弈方2博弈方12, 010, 16, 29, 0(3, 3)(2, 3)1212L(0, 0)NTVRM(1, 2)(1, 1)SU(2, 1)順推歸納法0,01,30,03,1swwsRD(2, 2)21Van Damme 博弈3,10,02,22,20,01,3DsRwsDw博弈方1博弈方2Van Damme 博弈策略形3.6.3 蜈蚣博弈問(wèn)題該博弈是說(shuō)明逆推歸納法和博弈分析困難的經(jīng)典博弈1211212R(98,98
51、)(97,100)dr(99,99)DRrd(98,101)(100,100)DRrd(0,3)D(2,2)R(1,1)D第四章 重復(fù)博弈 本章介紹基本博弈重復(fù)進(jìn)行構(gòu)成的重復(fù)博弈。雖然形式上是基本博弈的重復(fù)進(jìn)行,但重復(fù)博弈中博弈方的行為和博弈結(jié)果卻不一定是基本博弈的簡(jiǎn)單重復(fù),因?yàn)椴┺姆綄?duì)于博弈會(huì)重復(fù)進(jìn)行的意識(shí),會(huì)使他們對(duì)利益的判斷發(fā)生變化,從而使他們?cè)谥貜?fù)博弈過(guò)程中的行為選擇受到影響。這意味著不能把重復(fù)博弈當(dāng)作基本博弈的簡(jiǎn)單疊加,必須把整個(gè)重復(fù)博弈過(guò)程作為整體進(jìn)行研究。本章分三節(jié)4.1 重復(fù)博弈引論4.2 有限次重復(fù)博弈4.3 無(wú)限次重復(fù)博弈4.1 重復(fù)博弈引論4.1.1 為何研究重復(fù)博弈4.
52、1.2 基本概念4.1.1 為何研究重復(fù)博弈經(jīng)濟(jì)中的長(zhǎng)期關(guān)系人們的預(yù)見性未來(lái)利益對(duì)當(dāng)前行為的制約長(zhǎng)期合同、回頭客、長(zhǎng)客和一次性買賣的區(qū)別有無(wú)確定的結(jié)束時(shí)間4.1.2 基本概念有限次重復(fù)博弈:給定一個(gè)基本博弈G(可以是靜態(tài)博弈,也可以是動(dòng)態(tài)博弈),重復(fù)進(jìn)行T次G,并且在每次重復(fù)G之前各博弈方都能觀察到以前博弈的結(jié)果,這樣的博弈過(guò)程稱為“G的T次重復(fù)博弈”,記為G(T)。而G則稱為G(T)的“原博弈”。G(T)中的每次重復(fù)稱為G(T)的一個(gè)“階段”。無(wú)限次重復(fù)博弈:一個(gè)基本博弈G一直重復(fù)博弈下去的博弈,記為G( )策略:博弈方在每個(gè)階段針對(duì)每種情況如何行為的計(jì)劃子博弈:從某個(gè)階段(不包括第一階段)
53、開始,包括此后所有的重復(fù)博弈部分均衡路徑:由每個(gè)階段博弈方的行為組合串聯(lián)而成重復(fù)博弈的得益4.2 有限次重復(fù)博弈4.2.1 兩人零和博弈的有限次重復(fù)博弈4.2.2唯一純策略納什均衡博弈 的有限次重復(fù)博弈4.2.3多個(gè)純策略納什均衡博弈 的有限次重復(fù)博弈4.2.4 有限次重復(fù)博弈的民間定理4.2.1 兩人零和博弈的有限次重復(fù)博弈零和博弈是嚴(yán)格競(jìng)爭(zhēng)的,重復(fù)博弈并不改變這一點(diǎn)。以零和博弈為原博弈的有限次重復(fù)博弈與猜硬幣博弈的有限次重復(fù)博弈一樣,博弈方的正確策略是重復(fù)一次性博弈中的納什均衡策略。4.2.2唯一純策略納什均衡博弈的 有限次重復(fù)博弈定理:設(shè)原博弈G有唯一的純策略納什均衡,則對(duì)任意整數(shù)T,重
54、復(fù)博弈 G(T)有唯 一的子博弈完美納什均衡,即各博弈方每個(gè)階段都采用G的納什均衡策略。各博弈方在G(T)中的總得益為在G中得益的T倍,平均得益的與原博弈G中的得益。-5,-50,-8-8,0-1,-1坦 白不坦白囚徒2坦白不坦白囚徒1(-5,-5)-10,-10-13,-5-5,-13-6,-6坦 白不坦白囚徒2坦白不坦白囚徒1(-10,-10)有限次重復(fù)削價(jià)競(jìng)爭(zhēng)博弈100,10020,150150,2070,70高 價(jià)低 價(jià)高價(jià)低價(jià)寡頭2寡頭1削價(jià)競(jìng)爭(zhēng)博弈有唯一純策略納什均衡(70,70)有限次重復(fù)的結(jié)果仍然是(低價(jià),低價(jià))4.2.3多個(gè)純策略納什均衡博弈的 有限次重復(fù)博弈5,53,32,
55、00,22,06,00,20,61,1HMH廠商2ML廠商1L三價(jià)博弈2,23,13,11,34,47,11,31,78,8廠商1廠商2LMHHML兩次重復(fù)三價(jià)博弈的等價(jià)模型觸發(fā)策略:兩博弈方先試探合作,一旦發(fā)現(xiàn)對(duì)方不合作則也用不合作報(bào)復(fù)博弈方1:第一次選h;如第一次結(jié)果為(H,H),則第二次選M,否則選L博弈方2:同博弈方1兩市場(chǎng)博弈的重復(fù)博弈(重復(fù)兩次)(A,B)+(A,B) OR (B,A)+(B,A)(1,4)(4,1)連續(xù)兩次采用混合策略(2,2)(A,B)+(B,A) OR (B,A)+(A,B)(2.2,2.5)輪換策略一次純策略+一次混合策略(1.5,3)(3,1.5)0,04
56、,11,33,3廠商1廠商2BAAB兩市場(chǎng)博弈重復(fù)博弈不同策略、均衡及一次性博弈得益比較不同策略組合、均衡得益圖示廠商2得益廠商1得益(1,4)(3,3)(2.5,2.5)(2,2)(3,1.5)(4,1)(1.5,3)4.2.4 有限次重復(fù)博弈的民間定理個(gè)體理性得益:不管其它博弈方的行為如何,一博弈方在某個(gè)博弈中只要自己采取某種特定的策略,最低限度保證能獲得的得益可實(shí)現(xiàn)得益:博弈中所有純策略組合得益的加權(quán)平均數(shù)組定理:設(shè)原博弈的一次性博弈有均衡得益數(shù)組優(yōu)于w,那么在該博弈的多次重復(fù)中所有不小于個(gè)體理性得益的可實(shí)現(xiàn)得益,都至少有一個(gè)子博弈完美納什均衡的極限的平均得益來(lái)實(shí)現(xiàn)它們廠商2得益廠商1得
57、益(1,4)(3,3)(1,1)(4,1)w=(1.1)4.3 無(wú)限次重復(fù)博弈4.3.1 兩人零和博弈的無(wú)限次重復(fù)博弈4.3.2 唯一純策略納什均衡博弈 的無(wú)限次重復(fù)博弈4.3.3 無(wú)限次重復(fù)古諾模型4.3.4 有效工資率4.3.1 兩人零和博弈的無(wú)限次重復(fù)博弈兩人零和博弈無(wú)限次重復(fù)的所有階段都不可能發(fā)生合作,博弈方會(huì)一直重復(fù)原博弈的混合策略納什均衡4.3.2唯一純策略納什均衡博弈 的無(wú)限次重復(fù)博弈兩寡頭削價(jià)競(jìng)爭(zhēng)博弈 該博弈一次性博弈均衡是都采用低價(jià),是囚徒困境型博弈4,40,55,01,1HLHL無(wú)限次重復(fù)兩寡頭削價(jià)博弈 觸發(fā)策略:第一階段采用H,如果前t-1階段的結(jié)果都是(H,H),則繼續(xù)
58、采用H,否則采用L。 如果博弈方2采用L,總得益現(xiàn)值為 如果博弈方2采用H,總得益現(xiàn)值為 因此當(dāng) 時(shí),此觸發(fā)策略納什均衡策略兩寡頭削價(jià)競(jìng)爭(zhēng)無(wú)限次重復(fù)博弈的民間定理廠商2得益廠商1得益(1,4)(3,3)(1,1)(4,1)(5,0)(5,0)4.3.3 無(wú)限次重復(fù)古諾模型 假定: ,邊際成本都為2。 在無(wú)限次重復(fù)古諾模型中,當(dāng)貼現(xiàn)率 滿足一定條件時(shí),兩廠商采用下列觸發(fā)策略構(gòu)成一個(gè)子博弈完美納什均衡: 在第一階段生產(chǎn)壟斷產(chǎn)量的一半1.5;在第 t 階段,如果前 t-1 階段結(jié)果都是(1.5,1.5),則繼續(xù)生產(chǎn)1.5,否則生產(chǎn)古諾產(chǎn)量2。 設(shè)廠商1已采用該觸發(fā)策略,若廠商2也采用該觸發(fā)策略,則每
59、期得益4.5,無(wú)限次重復(fù)博弈總得益的現(xiàn)值為: 如果廠商2偏離上述觸發(fā)策略,則他在第一階段所選產(chǎn)量應(yīng)為給定廠商1產(chǎn)量為1.5時(shí),自己的最大利潤(rùn)產(chǎn)量,即滿足: 解得 ,此時(shí)利潤(rùn)為5.0625,高于觸發(fā)策略第一階段得益4.5。 但從第二階段開始,廠商1將報(bào)復(fù)性地永遠(yuǎn)采用古諾產(chǎn)量2,這樣廠商2也被迫永遠(yuǎn)采用古諾產(chǎn)量,從此得利潤(rùn)4。因此,無(wú)限次重復(fù)博弈第一階段偏離的情況下總得益的現(xiàn)值為: 當(dāng) 上述策略是廠商2對(duì)廠商1的同樣觸發(fā)策略的最佳反應(yīng),否則偏離是最佳反應(yīng)。 4.3.4 有效工資率模型設(shè)定: 首先廠商選擇工資率為 ,然后工人選擇接受或拒絕。如果拒絕,則他作個(gè)體戶得到收入 小于 ,如果接受 ,則工人選
60、擇努力工作(負(fù)效用 )還是偷懶(無(wú)負(fù)效用)。 廠商只能看到產(chǎn)量高低,高產(chǎn)量為 ,低產(chǎn)量0。 工人努力工作時(shí)一定是高產(chǎn)量 ,不努力時(shí)卻并不一定是0,而是高產(chǎn)量 的概率為 ,低產(chǎn)量0的概率為 。 工人努力工作時(shí),廠商得益為 ,工人得益為 ; 工人偷懶時(shí),廠商期望得益為 ,工人得益為 ??紤]如下的觸發(fā)策略: 廠商在第一階段給工資率 ,在第t階段,如果前面t-1階段結(jié)果都是 則繼續(xù)給 ,否則從此永遠(yuǎn)是 。 工人的策略是如果 則接受,否則寧愿作個(gè)體戶得到 ,并在以前各期結(jié)果都是 和當(dāng)前工資率為 時(shí)努力工作,否則偷懶。 設(shè)廠商已采用上述觸發(fā)策略。由于 ,工人接受工作是最佳反應(yīng)。用 記工人努力工作時(shí)無(wú)限次重
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 修改利用合同范本賺錢
- 住宅合同范本
- 低價(jià)轉(zhuǎn)讓轉(zhuǎn)租合同范本
- 出售積水別墅合同范例
- 代理退保委托合同范本
- 信用貸購(gòu)車合同范例
- 關(guān)于承包保潔合同范本
- 《物資采購(gòu)合同范本》
- 養(yǎng)殖回購(gòu)合同范本
- 買裝修制式合同范本
- 巴馬格紡絲控制系統(tǒng)軟件說(shuō)明書(共46頁(yè))
- 肺結(jié)核患者管理ppt課件
- 煤矸石綜合利用項(xiàng)目可行性研究報(bào)告寫作范文
- 清華大學(xué)MBA課程——運(yùn)籌學(xué)
- 《計(jì)量經(jīng)濟(jì)學(xué)》超全題庫(kù)及答案(完整版)
- 濕法冶金浸出凈化和沉積PPT課件
- 生產(chǎn)現(xiàn)場(chǎng)作業(yè)十不干PPT課件
- 雨污水管網(wǎng)勞務(wù)施工分包合同
- 通信桿路工程施工
- 初中物理光學(xué)經(jīng)典題(共23頁(yè))
- 封條VVTT檢查流程程序參考模板
評(píng)論
0/150
提交評(píng)論