章完全信息靜態(tài)博弈

上傳人：洞*** IP屬地：北京上傳時(shí)間：2024-02-05 格式：PPTX 頁數(shù)：60 大小：980.49KB 積分：14 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩55頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第一篇非合作博弈理論完全信息靜態(tài)博弈完全信息動(dòng)態(tài)博弈不完全信息靜態(tài)博弈不完全信息動(dòng)態(tài)博弈1.完全信息靜態(tài)博弈1.1博弈論的基本概念及戰(zhàn)略式表述1.2納什均衡1.3納什均衡應(yīng)用舉例1.4混合戰(zhàn)略納什均衡1.5納什均衡的存在性和多重性的討論1.1博弈論的基本概念及戰(zhàn)略式表述開發(fā)商A下在考慮是否要在北京的某一地段開發(fā)一棟新的寫字樓。你面臨的選擇是開發(fā)或者不開發(fā)。如果決定開發(fā)，你必須投入1億資金；如果決定不開發(fā)，你的資金投入為0。開發(fā)商B也面臨與你同樣的決策問題。假定，如果市場上有兩棟樓出售，需求大時(shí)，每棟售價(jià)達(dá)1.4億元，需求小時(shí)，售價(jià)為7千萬；如果市場上只有一棟樓出售，需求大時(shí)售價(jià)為1.8億，需求小時(shí)為1.1億，這樣，有以下8種可能的結(jié)果：引例：“房地產(chǎn)開發(fā)博弈”1.1.1基本概念1．需求大，你開發(fā)，他不開發(fā)；你的利潤為8千萬，他的利潤為0。2．需求大，你不開發(fā)，他開發(fā)；你的利潤為0，他的利潤為8千萬。3．需求大，你開發(fā)，他也開發(fā)；你和他的利潤各為4千萬。4．需求大，你不開發(fā)，他不開發(fā)；你和他的利潤為0。5．需求小，你開發(fā)，他不開發(fā)；你的利潤為1千萬，他的利潤為0。6，需求小，你不開發(fā)，他開發(fā)；你的利潤為0，他的利潤為1千萬。7．需求小，你開發(fā)，他也開發(fā)；你和他的利潤各為-3千萬。8．需求小，你不開發(fā)，他不開發(fā)；你和他的利潤都為0。博弈論的基本概念包括：參與人、行動(dòng)、信息、戰(zhàn)略、支付(效用)、結(jié)果和均衡其中參與人、戰(zhàn)略和支付是描述一個(gè)博弈所需要的最少的要素，而行動(dòng)和信息是其“積木”。參與人、行動(dòng)和結(jié)果統(tǒng)稱為“博弈規(guī)則”(therulesofthegame).1.參與人(players)

參與人指的是一個(gè)博弈中的決策主體，他的目的是通過選擇行動(dòng)(或戰(zhàn)略)以最大化自己的支付(效用)水平。參與人可以是自然人，也可以是團(tuán)體。在博弈論中，“自然”(nature)作為“虛擬參與人”(pseudo-player)來處理。這里，“自然”是指決定外生的隨機(jī)變量的概率分布的機(jī)制?！白匀弧睕]有自己的支付和目標(biāo)函數(shù)。2．行動(dòng)(actionsormoves)

行動(dòng)是參與人在博弈的某個(gè)時(shí)點(diǎn)的決策變量

一般地，我們用ai表示第i個(gè)參與人的一個(gè)特定行動(dòng)，Ai={ai}表示供i選擇的所有行動(dòng)的集合(actionset，即策略集/行動(dòng)集)。在n人博弈中，n個(gè)參與人的行動(dòng)的有序集a=(a1,…,ai,…an)稱為“行動(dòng)組合”(actionprofile)，其中的第i個(gè)ai是第i個(gè)參與人的行動(dòng)。3．信息(information)

信息是參與人有關(guān)博弈的知識(shí)，特別是有關(guān)“自然”的選擇、其他參與人的特征和行動(dòng)的知識(shí)。信息集(informationset)是博弈論中描述參與人信息特征的一個(gè)基本概念，可理解為參與人在特定時(shí)刻有關(guān)變量的值的知識(shí)。一個(gè)參與人無法準(zhǔn)確知道的變量的全體屬于一個(gè)信息集。在博弈論中，“完美信息”和“完全信息”是兩個(gè)有聯(lián)系但又不完全的概念。

完美信息(perfectinformation)是指一個(gè)參與人對(duì)其他參與人(包括虛擬參與人“自然”)的行動(dòng)選擇有準(zhǔn)確了解的情況，即每一個(gè)信息集只包含一個(gè)值；完全信息(completeinformation)是指自然不首先行動(dòng)或自然的初始行動(dòng)被所有參與人準(zhǔn)確觀察到的情況，即沒有事前的不確定性?！肮餐R(shí)”(commonknowledge)指的是“所有參與人知道所有參與人知道，所有參與人知道所有參與人知道所有參與人知道……”的知識(shí)。一般地，我們用si表示第i個(gè)參與人的一個(gè)特定戰(zhàn)略，Si={si}代表第i個(gè)參與人的所有可選擇的戰(zhàn)略的集合(strategyset)。如果n個(gè)參與人每人選擇一個(gè)戰(zhàn)略，n維向量s=(s1…,si,…sn)稱為一個(gè)戰(zhàn)略組合(strategyprofile),其中si第i個(gè)參與人選擇的戰(zhàn)略。4．戰(zhàn)略(strategies)；戰(zhàn)略與行動(dòng)是兩個(gè)不同的概念，戰(zhàn)略是行動(dòng)的規(guī)則而不是行動(dòng)本身。在靜態(tài)博弈中，戰(zhàn)略和行動(dòng)是相同的。作為一種規(guī)則，戰(zhàn)略必須是完備的。戰(zhàn)略是參與人在給定信息集的情況下的行動(dòng)規(guī)則，它規(guī)定參與人在什么時(shí)候選擇什么行動(dòng)。

在現(xiàn)實(shí)有許多博弈中，即使所有參與人“共同”享有某種知識(shí)，每個(gè)參與人也許并不知道其他參與人知道這些知識(shí)，或者并不知道其他人知道自己擁有這些知識(shí)。這種情況被稱為“一致信念”(concordantbeliefs)。

博弈的一個(gè)基本特征是一個(gè)參與人的支付不僅取決于自己的戰(zhàn)略選擇，而且取決于所有其他參與人的戰(zhàn)略選擇即，ui是所有參與人的戰(zhàn)略選擇的函數(shù)：

ui=ui(s1,…,si,…sn)5．支付(payoff)在博弈論中，支付或者是指在一個(gè)特定的戰(zhàn)略組合下參與人行到的確定效用水平，或者是指人得到的期望效用水平。令ui為第i個(gè)參與人的支付(效用水平)u=(u1,…,ui,…un)為n個(gè)參與人的支付組合(payoffprofile)。6．結(jié)果(e)：結(jié)果是博弈分析者所感興趣的所有東西，如果均衡戰(zhàn)略組合，均衡行動(dòng)組合，均衡支付組合等。7．均衡(equilibrium)：均衡是所有參與人的最優(yōu)戰(zhàn)略的組合，一般記為s*=(s*1,…,s*i,…,s*n)其中，s*i是第i個(gè)參與人在均衡情況下的最優(yōu)戰(zhàn)略，它是i的所有可能戰(zhàn)略中ui或Eui最大化的戰(zhàn)略。博弈論中的均衡概念與一般均衡理論中市場供應(yīng)的均衡概念的區(qū)別?！熬狻焙汀熬饨Y(jié)果”(equilibriume)的區(qū)別，人們說“均衡”時(shí)他常常是指“均衡結(jié)果”。Static(orsimultaneous-move)gamesofcompleteinformation（完全信息靜態(tài)博弈）一個(gè)參與人集合（至少兩個(gè)參與人）每個(gè)參與人都有一個(gè)策略集/行動(dòng)集每個(gè)參與人針對(duì)策略組合，或者說對(duì)他所偏好的策略組合所獲得的收益{Player1,Player2,...Playern}S1S2...Snui(s1,s2,...sn),forall

S1,s2

S2,...sn

Sn.一個(gè)靜態(tài)（或同時(shí)行動(dòng)）博弈包括的要素:GameTheory--Chapter111同時(shí)行動(dòng)（Simultaneous-move）每個(gè)參與人在選擇他/她的策略時(shí)不知道其他參與人的選擇.完全信息（Completeinformation）每個(gè)參與人的策略和收益函數(shù)都是所有參與人的共同知識(shí)（commonknowledge）.對(duì)參與人的假設(shè)理性（Rationality）參與人的目的是使他的收益最大化參與人是完美的計(jì)算者每個(gè)參與人都知道其他參與人是理性的Static(orsimultaneous-move)gamesofcompleteinformation（完全信息靜態(tài)博弈）參與人是否合作?不.我們僅僅考慮非合作博弈（non-cooperativegames）時(shí)間順序每個(gè)參與人

在不知道其他人的選擇的情況下選擇他/她的策略si.然后每個(gè)參與人

得到他/她的收益

ui(s1,s2,...,sn).博弈結(jié)束.Static(orsimultaneous-move)gamesofcompleteinformation（完全信息靜態(tài)博弈）1.1.2博弈的戰(zhàn)略式表述博弈的兩種不同的表述方式:戰(zhàn)略式表述(strategicformrepresentation)擴(kuò)展式表述(extensiveformrepresentation)戰(zhàn)略式表述更適合于靜態(tài)博弈，而擴(kuò)展式表述更適合于討論動(dòng)態(tài)博弈。戰(zhàn)略式表述又稱為標(biāo)準(zhǔn)式表述(normalformrepresentation)，在這種表述中，所以參與人同時(shí)選擇各自的戰(zhàn)略，所有參與人選擇的戰(zhàn)略一起決定每個(gè)參與人的支付。更為準(zhǔn)確地講，戰(zhàn)略式表述給出：博弈的參與人集合：每個(gè)參與人的戰(zhàn)略空間：每個(gè)參與人的支付函數(shù)：我們將用

代表戰(zhàn)略式表述博弈。在兩寡頭博弈里，企業(yè)是參與人，產(chǎn)量是戰(zhàn)略空間，利潤是支付；戰(zhàn)略式博弈為：這里，qi和πi分別是第i個(gè)企業(yè)的產(chǎn)量和利潤。一個(gè)博弈被稱為有限博弈(finitegame)

第一、參與人的個(gè)數(shù)是有限的；第二、每個(gè)參與人可選擇的戰(zhàn)略是有限的

兩人有限博弈的戰(zhàn)略式表述可以用矩陣表來直觀地給出。表1.1是房地產(chǎn)開發(fā)博弈中開發(fā)商A和B同時(shí)行動(dòng)博弈的戰(zhàn)略式表述開發(fā)商B開發(fā)不開發(fā)

開發(fā)商B開發(fā)不開發(fā)

開發(fā)商A開發(fā)不開發(fā)4000，40008000，00，80000，0-3000，-30001000，00，10000，0(a)高需求情況(b)低需求情況開發(fā)商A開發(fā)不開發(fā)如果完全靜態(tài)博弈是一種最簡單的博弈，在這種博弈中，由于每個(gè)人是在不知其他人行動(dòng)的情況下選擇自己的行動(dòng)，戰(zhàn)略和行動(dòng)實(shí)際上是一回事。博弈分析的目的是預(yù)測博弈的均衡結(jié)果，即給定每個(gè)參與人都是理性的(rational)。納什均衡是完全信息靜態(tài)博弈解的一般概念，也是所有其他類型博弈解的基本要求。1.2納什均衡1.2.1占優(yōu)戰(zhàn)略均衡一個(gè)參與人的最優(yōu)戰(zhàn)略可能并不依賴于其他參與人的戰(zhàn)略選擇，就是說，不論其他參與人選擇什么戰(zhàn)略，他的最優(yōu)戰(zhàn)略是唯一的，這樣的最優(yōu)戰(zhàn)略被稱為“占優(yōu)戰(zhàn)略”(dominantstrategy).例如，“囚徒困境”。囚犯B坦白抵賴

坦白囚犯A

抵賴-8，-80，-10-10，0，-1，-1一般地，s*i稱為參與人i的(嚴(yán)格)占優(yōu)戰(zhàn)略，如果對(duì)應(yīng)所有的s-i,s*i是i的嚴(yán)格最優(yōu)選擇，即：對(duì)應(yīng)地，所有的

被稱為“劣戰(zhàn)略”(dominatedstrategies).記住，這里是i之外所有參與人戰(zhàn)略的組合。定義：

在博弈的戰(zhàn)略式表述中，如果對(duì)于所有的i,s*i是i的占優(yōu)戰(zhàn)略，那么，戰(zhàn)略組合

稱為占優(yōu)戰(zhàn)略均衡(dominant-strategyequilibrium)。占優(yōu)戰(zhàn)略均衡只要求每個(gè)參與人是理性的，而并不要求每個(gè)參與人知道其他參與人是理性的(也就是說，不要求“理性”是共同知識(shí))。囚徒困境反映了一個(gè)深刻的問題，即個(gè)人與團(tuán)體理性的沖突。這是合作博弈與非合作博弈的區(qū)別。1.2.2

重復(fù)剔除占優(yōu)均衡在每個(gè)參與人都有占優(yōu)戰(zhàn)略的情況下，占優(yōu)戰(zhàn)略均衡是一個(gè)非常合理的預(yù)測，但在絕大多數(shù)博弈中，占優(yōu)戰(zhàn)略均衡是不存在的。盡管如此，在有些博弈中，我們?nèi)钥梢詰?yīng)用占優(yōu)的邏輯找出均衡。在“智豬博弈”的例子中。顯然，這個(gè)博弈沒有占優(yōu)戰(zhàn)略均衡，所以不能應(yīng)用占優(yōu)戰(zhàn)略找出均衡。小豬按等待3，12，47，-1，0，0那么，什么是這個(gè)博弈的可能的均衡解呢？假定小豬是理性的，那么理性的小豬會(huì)選擇“等待”。再假定大豬知道小豬是理性的，那么大豬的最優(yōu)選擇只能是“按”。這是一個(gè)“多勞不多得，少勞不少得”的均衡。以上實(shí)際上是應(yīng)用了“重復(fù)剔除嚴(yán)格劣戰(zhàn)略”的思路

定義：令和是參與人i可選擇的兩個(gè)戰(zhàn)略(即)。如果對(duì)于任意的其他參與人的戰(zhàn)略組合，參與人從選擇得到的支付嚴(yán)格小于從選擇得到的支付，即：

我們說戰(zhàn)略嚴(yán)格劣于戰(zhàn)略（isstrictlydominatedby）。通常，

稱為相對(duì)于的劣戰(zhàn)略；對(duì)應(yīng)地，稱為相對(duì)于的優(yōu)戰(zhàn)略。占優(yōu)戰(zhàn)略均衡中的占優(yōu)戰(zhàn)略是相對(duì)于所有的占優(yōu)戰(zhàn)略。定義：

弱劣于戰(zhàn)略(

isstrictlydominatedby

)，如果對(duì)于所有的，且對(duì)于某些嚴(yán)格不等式成立。稱為相對(duì)于的弱占優(yōu)戰(zhàn)略。

按大豬等待重復(fù)剔除的占優(yōu)均衡：戰(zhàn)略組合稱為重復(fù)剔除的占優(yōu)均衡，如果重復(fù)剔除劣戰(zhàn)略后剩下的唯一的戰(zhàn)略組合。如果這種唯一的戰(zhàn)略組合是存在的，我們說該博弈是重復(fù)剔除占優(yōu)可解的(dominantcesolvable)。一個(gè)抽象的例子：

在這個(gè)例子中，參與人A有兩個(gè)戰(zhàn)略：SA=(U,D),參與人B有三個(gè)戰(zhàn)略：SB=(L,M,R)。A的戰(zhàn)略中沒有一個(gè)嚴(yán)格優(yōu)于另一個(gè)：如果B選擇L或M，U是最優(yōu)的(1>0)，但如果B選擇R，D是最優(yōu)的(2>0)。然而，對(duì)B來說，M嚴(yán)格優(yōu)于R，故理性的參與人B不會(huì)選擇R。如果參與人A知道參與人B是理性的，R被剔除，A將選擇自己的戰(zhàn)略，似乎面對(duì)的是如表1.4(b)所代表的博弈。在這個(gè)新的中，U嚴(yán)格優(yōu)于D。這樣，如果B知道A是理性的，并且B知道A知道B是理性的(從而B知道1.4表(b)是適用的)，D將被從其戰(zhàn)略中剔除，我們行到如表1.4(C)所示的博弈。這個(gè)博弈實(shí)際上是一個(gè)單人決策問題，M嚴(yán)格優(yōu)于L，L將被剔除。這樣，(U，M)是剩下的唯一的戰(zhàn)略組合。參與人BLM1，01，20，10，30，12，01，01，20，30，11，01，2參與人BLMR

參與人BLM參與人AU

D參與人AU

(a)(b)(c)參與人AU

D如果每次剔除的是嚴(yán)格，均衡結(jié)果與剔除的順序無關(guān)。如果的是弱劣戰(zhàn)略，均衡結(jié)果可能與剔除順序有關(guān)。如表1.5參與人BC1C2C32，121，101，120，120，100，110，120，100，13參與人的戰(zhàn)略空間越大，需要的步驟就越多，對(duì)共同知識(shí)的要求就越嚴(yán)格。由于這個(gè)原因，盡管在許多博弈中得利剔除的占優(yōu)均衡是一個(gè)合理的，但這一點(diǎn)并非總是如此，特別是當(dāng)支付取某些極端值的時(shí)候。參與人BLR

U參與人AD8，10-1000，97，66，5這個(gè)例子說明，在類似右表所示的博弈中，博弈的結(jié)果對(duì)行為的不確定性是很敏感的，即使是很小的不確定性。在單人決策分析里，只有一個(gè)決策人，他面臨的唯一不確定性是“自然”可能的行動(dòng)，他對(duì)自然選擇不同行支的概率有一個(gè)固定的、外生的信念。相反，在博弈分析中，有多個(gè)，每個(gè)決策人有關(guān)其他決策人的行為的信念并不是外生的。由于這個(gè)區(qū)別，許多我們所熟悉的決策論中的比較靜態(tài)結(jié)論并不能推廣到博弈論中。參見表1.7，1.8博弈分析與單人分析的一個(gè)重要區(qū)別

R1參與人AR2R31.2.3納什均衡納什均衡是完全信息博弈解的一般概念，構(gòu)成納什均衡的戰(zhàn)略一定是重復(fù)剔除嚴(yán)格劣過程中不能被剔除的戰(zhàn)略，就是說，沒有任何一個(gè)戰(zhàn)略嚴(yán)格優(yōu)于納什均衡戰(zhàn)略。定義：有n個(gè)參與人的戰(zhàn)略式表述博弈，戰(zhàn)略組合是一個(gè)納什均衡，如果對(duì)于每一個(gè)i,是給定其他參與人選擇的情況下第i個(gè)參與人的最優(yōu)戰(zhàn)略，即：或者用另一種表述方式，是下述最大化問題的解：(1)每一個(gè)占優(yōu)戰(zhàn)略均衡、重復(fù)剔除的占優(yōu)均衡一定是納什均衡，但并非每一個(gè)納什均衡都是占優(yōu)戰(zhàn)略均衡或重復(fù)剔除的占優(yōu)均衡。(2)納什均衡一定是在重復(fù)剔除嚴(yán)格劣戰(zhàn)略過程中沒有被剔除掉的戰(zhàn)略組合，但沒有被剔除戰(zhàn)略組合，不一定是納什均衡，除非它是唯一的。納什均衡與占優(yōu)戰(zhàn)略均衡及重復(fù)剔除的占優(yōu)均衡之間的關(guān)系。如果使用弱劣戰(zhàn)略剔除的辦法，均衡結(jié)果可能與剔除順序有關(guān)。例如：一個(gè)市場進(jìn)入的例子：有一個(gè)壟斷者已在市場上(稱為“在位者”)，另一個(gè)企業(yè)虎視眈眈想進(jìn)入(稱為“進(jìn)入者”)。進(jìn)入者有兩可以選擇：(進(jìn)入，不進(jìn)入)；在位者也有兩個(gè)戰(zhàn)略：(默許，斗爭)。假定進(jìn)入之前的壟斷利潤為300，進(jìn)入之后寡頭利潤為100，進(jìn)入成本為10。各種戰(zhàn)略組合下的支付矩陣如下表所示：

在位者默許斗爭40，50-10，00，3000，300進(jìn)入進(jìn)入者不進(jìn)入這個(gè)例子說明，(弱)納什均衡允許弱劣戰(zhàn)略的存在納什均衡是參與人將如何博弈的“一致性”(consistent)預(yù)測：如果所有參與人預(yù)測一個(gè)特定的納什均衡將會(huì)出現(xiàn)，那么，沒有人有興趣作不同的選擇從而，納什均衡且只有納什均衡具有這樣的特征：

參與人預(yù)測到均衡，參與人預(yù)測到其他參與人預(yù)測到均衡，等等1.3納什均衡應(yīng)用舉例1.3.1庫諾特(Cournot)寡頭競爭模型1.3.2豪泰林(Hotelling)價(jià)格競爭模型1.3.3公共地的悲劇1.3.4公共物品的私人自愿供給1.3.5基礎(chǔ)設(shè)施建設(shè)：中央政府和地方政府之間的博弈

（不要求）1.3.1庫諾特(Cournot)雙寡頭競爭模型庫諾特寡頭競爭模型里，有兩個(gè)參與人，分別稱為企業(yè)1和企業(yè)2；每個(gè)企業(yè)的戰(zhàn)略是選擇產(chǎn)量；支付是利潤，它是兩個(gè)企業(yè)產(chǎn)量的函數(shù)是納什均衡產(chǎn)量意味著：找出納什均衡的一個(gè)辦法是對(duì)每個(gè)企業(yè)的利潤函數(shù)求一階導(dǎo)數(shù)并令其等于零：用代表第i個(gè)企業(yè)的產(chǎn)量，Ci(qi)代表成本函數(shù)，P=P(q1+q2)代表逆需求函數(shù)(P是價(jià)格；Q(P)是原需求函數(shù))。第i個(gè)企業(yè)的利潤函數(shù)為：上述兩個(gè)一階條件分別定義了兩個(gè)反應(yīng)函數(shù)(reactionfunction):反應(yīng)函數(shù)意味著每個(gè)企業(yè)的最優(yōu)戰(zhàn)略(產(chǎn)量)是另一個(gè)企業(yè)產(chǎn)量的函數(shù)。兩個(gè)反應(yīng)函數(shù)的交叉點(diǎn)就是納什均衡R1(q2)R2(q1)NE為了得到更具體的結(jié)果，考慮上述模型的簡單情況。假定每個(gè)企業(yè)具有相同的單位成本，即：需求函數(shù)取如下線性形式：

那么，最優(yōu)化的一階條件分別為：反應(yīng)函數(shù)為：就是說，j每增加1個(gè)單位的產(chǎn)量，i將減少1/2單位的產(chǎn)量。解兩個(gè)反應(yīng)函數(shù)，得納什均衡為：每個(gè)企業(yè)的納什均衡利潤分別為:為了與情況作比較，計(jì)算壟斷企業(yè)的最優(yōu)產(chǎn)量和均衡利潤。壟斷企業(yè)的問題是：最優(yōu)產(chǎn)量為：壟斷利潤為：思考結(jié)果是滿足這樣的：若一開始就假設(shè)：結(jié)論是否仍然是(q待定)寡頭競爭的總產(chǎn)量大于壟斷產(chǎn)量的原因在于每個(gè)企事業(yè)在選擇自己的最優(yōu)產(chǎn)量時(shí)，只考慮對(duì)本企業(yè)利潤的影響，而忽視對(duì)另一個(gè)企業(yè)的外部負(fù)效應(yīng)。這是典型的囚徒困境問題。庫諾特模型也可以使用重復(fù)剔除嚴(yán)格劣戰(zhàn)略的方法找出均衡解重復(fù)剔除嚴(yán)格劣戰(zhàn)略過程產(chǎn)生為唯一均衡，即納什均衡

在上述討論中，我們隱含地假定穩(wěn)定的均衡是存在的，且是唯一的，滿足這個(gè)要求的條件是，利潤函數(shù)是嚴(yán)格凹的交叉函數(shù)偏導(dǎo)數(shù)是負(fù)的此外，還要求兩曲線只交叉一次，且在交叉點(diǎn)R1比R2更陡。滿足這些條件的庫諾模型是重復(fù)剔除嚴(yán)格劣戰(zhàn)略可解的。如果這些條件不滿足，我們就無法用重復(fù)剔除的辦法找到均衡解。此外，如果存在3個(gè)以上的寡頭企業(yè)，重復(fù)剔除也無法給出均衡解。這兩個(gè)條件意味著反應(yīng)函數(shù)R1和R2是斜率為負(fù)的連續(xù)函數(shù)；補(bǔ)充：伯川德寡頭競爭模型(同質(zhì)產(chǎn)品)兩企業(yè)（企業(yè)1，企業(yè)2）進(jìn)行價(jià)格競爭，企業(yè)1價(jià)格p1,企業(yè)2價(jià)格p2,Ifp1<p2

，企業(yè)1的市場需求函數(shù)q1=a-p1企業(yè)2的市場需求函數(shù)為0；反之類似；If

p1=p2=p

，企業(yè)1,2的市場需求函數(shù)

q1=q2=(a-p)/2

邊際成本為常數(shù)c,c<a,兩個(gè)企業(yè)同時(shí)選擇價(jià)格，則納什均衡定價(jià)為c

.此時(shí)，企業(yè)利潤為零，(BertrandParadox)

伯川德雙寡頭競爭模型(異質(zhì)產(chǎn)品)伯川德(Bertrand)(1983)Bertrand均衡（選擇產(chǎn)量）VsCournot均衡（選擇價(jià)格）企業(yè)1和2選擇價(jià)格P1

和P2，消費(fèi)者選擇對(duì)企業(yè)i

的產(chǎn)品的需求為：伯川德雙寡頭競爭模型(異質(zhì)產(chǎn)品)其中，b>0,企業(yè)的邊際成本為c,c<a,兩企業(yè)同時(shí)行動(dòng)。

均衡求解：企業(yè)i的利潤為：pi應(yīng)該是最優(yōu)化問題的解，因此,因此，伯川德雙寡頭競爭模型(異質(zhì)產(chǎn)品)1.3.2豪泰林(Hotelling)價(jià)格競爭模型Pi為商店i的價(jià)格，Di(p1,p2)為需求函數(shù)，i=1,2。如果住在x的消費(fèi)者在兩個(gè)商店之間是無差異的，那么，所有住在x左邊的將都在商店1購買…需求分別為D1=x,D2=1-x。x滿足：“伯川德悖論”(BertrandParedox):即使只有兩個(gè)企業(yè)，在均衡情況下，價(jià)格等于邊際成本，企業(yè)的利潤為零，與完全競爭商場均衡一樣。解決辦法之一是引入產(chǎn)品的差異性?？臻g上的差異（spacialdifferentiation）,即經(jīng)典的豪泰林（hotelling）模型。物質(zhì)上有差異的模型（Bertrand寡頭競爭模型,Gibbons,P17）產(chǎn)品在物質(zhì)性能上是相同的，但在空間位置上有差異。因?yàn)椴煌恢蒙系南M(fèi)者要支付不同的運(yùn)輸成本?？紤]兩商店之間價(jià)格競爭的納什均衡。解上式得需求函數(shù)分別為：利潤函數(shù)分別為：商店i選擇自己的價(jià)格pi最大化利潤，給定，兩個(gè)一階條件分別是：解上述兩個(gè)一階條件，得最優(yōu)解為：每個(gè)企事業(yè)的均衡利潤為：以上分析中，我們假定兩個(gè)商店分別位于城市的兩個(gè)極端。另一個(gè)極端的情況，假定兩個(gè)商店位于同一個(gè)位置x。，此時(shí)，伯川德均衡是唯一的均衡：更為一般地，我們可以討論商店位于任何位置的情況。假定商店1位于,商店2位于（這里）。需求函數(shù)分別為：

,當(dāng)納什均衡為：當(dāng)時(shí)，即為第一種情況：當(dāng)時(shí)，為第二種情況：1.3.3公共地的悲劇這個(gè)例子證明，如果一種資源沒有排他性的所有權(quán)，就會(huì)導(dǎo)致對(duì)這種資源的過度使用考慮一個(gè)有n個(gè)農(nóng)民的村莊共同擁有一片草地，每個(gè)農(nóng)民都有在草地上放牧的自由。每年春天，每個(gè)農(nóng)民要決定自己養(yǎng)多少只羊。用,代表第i個(gè)農(nóng)民飼養(yǎng)的數(shù)量，，代表n個(gè)農(nóng)民飼養(yǎng)的總數(shù)量；v代表每只羊的平均價(jià)值。v是G的函數(shù)，一個(gè)重要的假設(shè)是最大可存活的數(shù)量:當(dāng)假定：如圖：每只羊的價(jià)值隨飼養(yǎng)總數(shù)量的增加而下降在這個(gè)博弈里，每個(gè)農(nóng)民的問題是選擇以最大化自己的利潤。假定購買一只羊羔的價(jià)格為c,那么，利潤函數(shù)為：

最優(yōu)化的一階條件是：上述n個(gè)一階條件定義了n個(gè)反應(yīng)函數(shù)：因?yàn)樗约吹趇個(gè)農(nóng)民的最優(yōu)飼養(yǎng)量隨其它農(nóng)民的飼養(yǎng)量的增加遞減N個(gè)反應(yīng)函數(shù)的交叉點(diǎn)就納什均衡：納什均衡的總飼養(yǎng)量為將n個(gè)一階條件相加，得到：社會(huì)最優(yōu)的目標(biāo)是最大化如下定義的社會(huì)總剩余價(jià)值：最優(yōu)化的一階條件為：比較社會(huì)最優(yōu)的一階條件與個(gè)人最優(yōu)的一階條件可以看到：這就是公共地的悲劇。推導(dǎo)過程？比較的方法1.3.4公共物品的私人自愿供給公共物品的私人自愿供給會(huì)導(dǎo)致供給不足。設(shè)想一個(gè)由n個(gè)居民組成的社團(tuán)正建設(shè)一座防洪大堤的情況……第i個(gè)居民的貢獻(xiàn)為gi，總供給為。i的效用函數(shù)為，這里是私人物品的消費(fèi)量。假定，且私人物品和公共物品之間的邊際替代率是遞減的。令為私人物品的價(jià)格，為沙袋的價(jià)格，為個(gè)人總預(yù)算收入。那么，每個(gè)居民面臨的問題是給定其他居民的選擇的情況下，選擇自己的最優(yōu)戰(zhàn)略以最大化下列目標(biāo)函數(shù)：最優(yōu)化的一階條件為：故假定其他人的選擇給定。n個(gè)均衡條件決定了公共物品自愿供給的納什均衡：考慮帕累托（Pareto）最優(yōu)解。假定社會(huì)福利函數(shù)采取下列形式：總預(yù)算約束為：帕累托最優(yōu)的一階條件是用n個(gè)等式消除掉，我們得到均衡條件：這就是存在公共物品情況下帕累托最優(yōu)的薩繆爾遜條件。上述條件可重寫為：結(jié)論：Pareto最優(yōu)供給>Nash均衡供給假定個(gè)人效用函數(shù)取柯布－道格拉斯形式，即這里，則個(gè)人最優(yōu)的均衡條件為：將預(yù)算條件代入整理，得反應(yīng)函數(shù)為一般地，如果所有居民有相同的收入水平M，均衡情況下所有居民提供相同的公共物品，納什均衡為：納什均衡的總供給為：在所有人具有相同收入的假設(shè)下，帕累托最優(yōu)的一階條件為：將預(yù)算約束代入，得到單個(gè)人的帕累托最優(yōu)貢獻(xiàn)為公共物品的總供給為：納什均衡的總供給與帕累托最優(yōu)的總供給的比率為：就是說，公共物品的納什均衡供給小于帕累托最優(yōu)供給，且二者之間的差距隨著社區(qū)居民人數(shù)的增加而擴(kuò)大。此外，供給不足的程度會(huì)隨著收入分配差距的擴(kuò)大而減弱（Olson,1982）。比如說，假定社區(qū)由兩人組成，如果，納什均衡為：納什均衡總供給為：對(duì)比這下，如果居民1的收入是居民2的2倍即，假定，納什均衡為：容易驗(yàn)證，收入平均分配下的納什均衡總供給小于收入分配不均時(shí)的納什均衡供給：上述例子表明，當(dāng)收入分配不平均時(shí)，公共物品的自愿供給可能變成一個(gè)智豬博弈。在有些情況下，公共物品的提供也可能變成一個(gè)斗雞博弈問題。如下：公共物品的斗雞博弈

富人B修不修

富人A修不修1.3.5基礎(chǔ)設(shè)施建設(shè)：

中央政府和地方政府之間的博弈3，32，44，21，1總結(jié)：公共物品的供給可能是一個(gè)囚徒困境問題，也可能是智豬博弈問題，還可能是一個(gè)斗雞博弈問題，依環(huán)境而定。靜態(tài)博弈分析解釋中央政府和地方政府基礎(chǔ)設(shè)施建設(shè)上的博弈：假定中央政府和地方政府投資的收益函數(shù)分別取如下柯布－道格拉斯形式：中央政府：地方政府：

用和分別代表中央政府和地方政府可用于投資的總預(yù)算資金。假定中央政府和地方政府的都是在滿足預(yù)算約束的前提下最大化各自的收益函數(shù)。那么，中央政府的問題是：地方政府的問題是：解之，得反應(yīng)函數(shù)分別為：中央政府：地方政府：上述反應(yīng)意味著：

Odbca圖1.4基礎(chǔ)設(shè)施投資的博弈即在均衡點(diǎn)，至少有一方的最優(yōu)解是角點(diǎn)解。

代表中央政府的反應(yīng)曲線，代表地方政府的反應(yīng)曲線；使用重復(fù)剔除嚴(yán)格劣戰(zhàn)略的方法，經(jīng)過不斷重復(fù)剔除，（0，OC）是唯一剩下的戰(zhàn)略組合。命題1：如果納什均衡是：，即地方政府將全部資金投資于加工業(yè)，中央政府滿足所有基礎(chǔ)設(shè)施投資的需求，然后將剩余資金投資于加工業(yè)。考慮的情況。

使用圖1.4容易證明：命題2：如果，納什均衡為：納什均衡為：即地方政府將全部資金投資于加工業(yè)，中央政府將全部資金投資于基礎(chǔ)設(shè)施。再考慮的情況，有：命題3：如果，納什均衡為：即中央政府將全部資金投資于基礎(chǔ)設(shè)施建設(shè)，地方政府“彌補(bǔ)”中央投資的不足直到地主政府的理想狀態(tài)，然后將剩余資金投資于加工業(yè)。綜合上述三種情況，在第一種情況下，投資資金的分配格局滿足了中央政府的偏好：在第二種情況下，投資資金的分配格局介于中央政府的偏好和地方政府的偏好之間：在第三種情況下，投資資金的分配格局滿足了地方政府和偏好：上述模型大致可以解釋改革開放以來中國基礎(chǔ)設(shè)施投資格局的變化過程

1.4混合戰(zhàn)略納什均衡-1，11，-11，-1-1，1在前面，我們將納什均衡定義為一組滿足所有參與人的效用最大化要求的戰(zhàn)略組合，根據(jù)這一定義，有些博弈不存在納什均衡?？紤]下面兩個(gè)例子：流浪漢尋找工作游蕩

政府救濟(jì)不救濟(jì)3，2-1，3-1，10，0兒童B正面反面兒童A正面反面社會(huì)福利博弈猜謎游戲

上述兩個(gè)博弈的顯著特征是，每一個(gè)參與人都想猜透對(duì)方的戰(zhàn)略，而每一個(gè)參與人又都不能讓對(duì)方猜透自己的戰(zhàn)略。在這類博弈中，都不存在納什均衡。如果一個(gè)戰(zhàn)略規(guī)定參與人在每一個(gè)給定的信息情況下只選擇一種特定的行動(dòng)，我們稱該戰(zhàn)略為。相反，如果一個(gè)戰(zhàn)略規(guī)定參與人在給定信息情況下以某種概率分布隨機(jī)地選擇不同的行動(dòng)，我們稱該戰(zhàn)略為。在博弈的戰(zhàn)略式表述中，混合戰(zhàn)略可以定義為在純戰(zhàn)略空間上的概率分布。在靜態(tài)博弈里，純戰(zhàn)略等價(jià)于特定的行動(dòng)，混合戰(zhàn)略是不同行動(dòng)之間的隨機(jī)選擇。純戰(zhàn)略混合戰(zhàn)略定義：在n個(gè)參與人博弈的戰(zhàn)略式表述中，假定參與人i有K個(gè)純戰(zhàn)略：，那么，概率分布稱為i的一個(gè)混合戰(zhàn)略，這里是i選擇的概率，對(duì)于所有的使用上述定義，純戰(zhàn)略可以理解為混合戰(zhàn)略的特例。（（用代表i的混合戰(zhàn)略空間代表混合戰(zhàn)略空間組合，其中為的一個(gè)混合戰(zhàn)略，代表混合戰(zhàn)略組合空間。））重新定義納什均衡：定義：在n個(gè)參與人博弈的戰(zhàn)略式表述中，混合戰(zhàn)略組合是一個(gè)納什均衡，如果對(duì)于所有的下式成立：納什均衡也可以表述如下：定義：是一個(gè)納什均衡，如果對(duì)于所有的參與人i,以社會(huì)福利博弈為例求解混合戰(zhàn)略納什均衡假定政府的混合戰(zhàn)略為，流浪漢的混合戰(zhàn)略為政府的期望效用函數(shù)為：對(duì)上述效用函數(shù)求微分，得到政府最優(yōu)化的一階條件為：因此，即，在混合戰(zhàn)略均衡中，流浪漢以0.2的概率選擇尋找工作，以0.8的概率選擇游蕩。為了找出政府的均衡混合戰(zhàn)略，我們需要求解流浪漢的最優(yōu)化問題。給定流浪漢的期望效用函數(shù)為：最優(yōu)化的一階條件為：因此我們可以使用反應(yīng)對(duì)應(yīng)的概念來描述一個(gè)參與人對(duì)應(yīng)與其他參與人混合戰(zhàn)略的最優(yōu)選擇。在上述博弈中，政府和流浪漢的反應(yīng)對(duì)應(yīng)分別為：政府：流浪漢：

0.20.5

11圖1.5混合戰(zhàn)略納什均衡海薩尼對(duì)混合戰(zhàn)略的解釋是，混合戰(zhàn)略均衡等價(jià)于不完全信息下的純戰(zhàn)略均衡。盡管混合戰(zhàn)略不像純戰(zhàn)略那樣直觀，但它確實(shí)是一些博弈中參與人的合理行為方式。經(jīng)注學(xué)上的監(jiān)督博弈也是這樣的一個(gè)例子：給定，納稅人選擇逃稅和不逃稅的期望收益分別為：用代表稅收機(jī)關(guān)檢查的概率，代表納稅人逃稅的概率。給定，稅收機(jī)關(guān)選擇檢查和不檢查的期望收益分別為：監(jiān)督博弈表1.14概括了對(duì)應(yīng)不同純戰(zhàn)略組合的支付矩陣。納稅人逃稅不逃稅稅收機(jī)關(guān)檢查不檢a-C+F,-a-Fa-C,-a0,0a，-a解，得：解得：因此，混合戰(zhàn)略納什均衡是：

以上討論的是不存在純戰(zhàn)略納什均衡但存在混合戰(zhàn)略納什均衡的博弈。有些博弈既存在純戰(zhàn)略均衡，也存在混合戰(zhàn)略均衡。所謂的“性別戰(zhàn)”就是這樣一個(gè)博弈。女足球芭蕾男足球2，10，0芭蕾0，01，2這個(gè)博弈有兩個(gè)純戰(zhàn)略納什均衡：（足球，足球），（芭蕾，芭蕾）。事實(shí)上，這個(gè)博弈還有一個(gè)混合戰(zhàn)略納什均衡：男的以2/3的概率選擇足球賽，1/3

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

章完全信息靜態(tài)博弈

文檔簡介

溫馨提示

最新文檔

評(píng)論

章完全信息靜態(tài)博弈

文檔簡介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔