版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第一篇非合作博弈理論完全信息靜態(tài)博弈完全信息動(dòng)態(tài)博弈不完全信息靜態(tài)博弈不完全信息動(dòng)態(tài)博弈1.完全信息靜態(tài)博弈1.1博弈論的基本概念及戰(zhàn)略式表述1.2納什均衡1.3納什均衡應(yīng)用舉例1.4混合戰(zhàn)略納什均衡1.5納什均衡的存在性和多重性的討論1.1博弈論的基本概念及戰(zhàn)略式表述開發(fā)商A下在考慮是否要在北京的某一地段開發(fā)一棟新的寫字樓。你面臨的選擇是開發(fā)或者不開發(fā)。如果決定開發(fā),你必須投入1億資金;如果決定不開發(fā),你的資金投入為0。開發(fā)商B也面臨與你同樣的決策問題。假定,如果市場上有兩棟樓出售,需求大時(shí),每棟售價(jià)達(dá)1.4億元,需求小時(shí),售價(jià)為7千萬;如果市場上只有一棟樓出售,需求大時(shí)售價(jià)為1.8億,需求小時(shí)為1.1億,這樣,有以下8種可能的結(jié)果:引例:“房地產(chǎn)開發(fā)博弈”1.1.1基本概念1.需求大,你開發(fā),他不開發(fā);你的利潤為8千萬,他的利潤為0。2.需求大,你不開發(fā),他開發(fā);你的利潤為0,他的利潤為8千萬。3.需求大,你開發(fā),他也開發(fā);你和他的利潤各為4千萬。4.需求大,你不開發(fā),他不開發(fā);你和他的利潤為0。5.需求小,你開發(fā),他不開發(fā);你的利潤為1千萬,他的利潤為0。6,需求小,你不開發(fā),他開發(fā);你的利潤為0,他的利潤為1千萬。7.需求小,你開發(fā),他也開發(fā);你和他的利潤各為-3千萬。8.需求小,你不開發(fā),他不開發(fā);你和他的利潤都為0。博弈論的基本概念包括:參與人、行動(dòng)、信息、戰(zhàn)略、支付(效用)、結(jié)果和均衡其中參與人、戰(zhàn)略和支付是描述一個(gè)博弈所需要的最少的要素,而行動(dòng)和信息是其“積木”。參與人、行動(dòng)和結(jié)果統(tǒng)稱為“博弈規(guī)則”(therulesofthegame).1.參與人(players)
參與人指的是一個(gè)博弈中的決策主體,他的目的是通過選擇行動(dòng)(或戰(zhàn)略)以最大化自己的支付(效用)水平。參與人可以是自然人,也可以是團(tuán)體。在博弈論中,“自然”(nature)作為“虛擬參與人”(pseudo-player)來處理。這里,“自然”是指決定外生的隨機(jī)變量的概率分布的機(jī)制?!白匀弧睕]有自己的支付和目標(biāo)函數(shù)。2.行動(dòng)(actionsormoves)
行動(dòng)是參與人在博弈的某個(gè)時(shí)點(diǎn)的決策變量
一般地,我們用ai表示第i個(gè)參與人的一個(gè)特定行動(dòng),Ai={ai}表示供i選擇的所有行動(dòng)的集合(actionset,即策略集/行動(dòng)集)。在n人博弈中,n個(gè)參與人的行動(dòng)的有序集a=(a1,…,ai,…an)稱為“行動(dòng)組合”(actionprofile),其中的第i個(gè)ai是第i個(gè)參與人的行動(dòng)。3.信息(information)
信息是參與人有關(guān)博弈的知識(shí),特別是有關(guān)“自然”的選擇、其他參與人的特征和行動(dòng)的知識(shí)。信息集(informationset)是博弈論中描述參與人信息特征的一個(gè)基本概念,可理解為參與人在特定時(shí)刻有關(guān)變量的值的知識(shí)。一個(gè)參與人無法準(zhǔn)確知道的變量的全體屬于一個(gè)信息集。在博弈論中,“完美信息”和“完全信息”是兩個(gè)有聯(lián)系但又不完全的概念。
完美信息(perfectinformation)是指一個(gè)參與人對其他參與人(包括虛擬參與人“自然”)的行動(dòng)選擇有準(zhǔn)確了解的情況,即每一個(gè)信息集只包含一個(gè)值;完全信息(completeinformation)是指自然不首先行動(dòng)或自然的初始行動(dòng)被所有參與人準(zhǔn)確觀察到的情況,即沒有事前的不確定性?!肮餐R(shí)”(commonknowledge)指的是“所有參與人知道所有參與人知道,所有參與人知道所有參與人知道所有參與人知道……”的知識(shí)。一般地,我們用si表示第i個(gè)參與人的一個(gè)特定戰(zhàn)略,Si={si}代表第i個(gè)參與人的所有可選擇的戰(zhàn)略的集合(strategyset)。如果n個(gè)參與人每人選擇一個(gè)戰(zhàn)略,n維向量s=(s1…,si,…sn)稱為一個(gè)戰(zhàn)略組合(strategyprofile),其中si第i個(gè)參與人選擇的戰(zhàn)略。4.戰(zhàn)略(strategies);戰(zhàn)略與行動(dòng)是兩個(gè)不同的概念,戰(zhàn)略是行動(dòng)的規(guī)則而不是行動(dòng)本身。在靜態(tài)博弈中,戰(zhàn)略和行動(dòng)是相同的。作為一種規(guī)則,戰(zhàn)略必須是完備的。戰(zhàn)略是參與人在給定信息集的情況下的行動(dòng)規(guī)則,它規(guī)定參與人在什么時(shí)候選擇什么行動(dòng)。
在現(xiàn)實(shí)有許多博弈中,即使所有參與人“共同”享有某種知識(shí),每個(gè)參與人也許并不知道其他參與人知道這些知識(shí),或者并不知道其他人知道自己擁有這些知識(shí)。這種情況被稱為“一致信念”(concordantbeliefs)。
博弈的一個(gè)基本特征是一個(gè)參與人的支付不僅取決于自己的戰(zhàn)略選擇,而且取決于所有其他參與人的戰(zhàn)略選擇即,ui是所有參與人的戰(zhàn)略選擇的函數(shù):
ui=ui(s1,…,si,…sn)5.支付(payoff)在博弈論中,支付或者是指在一個(gè)特定的戰(zhàn)略組合下參與人行到的確定效用水平,或者是指人得到的期望效用水平。令ui為第i個(gè)參與人的支付(效用水平)u=(u1,…,ui,…un)為n個(gè)參與人的支付組合(payoffprofile)。6.結(jié)果(e):結(jié)果是博弈分析者所感興趣的所有東西,如果均衡戰(zhàn)略組合,均衡行動(dòng)組合,均衡支付組合等。7.均衡(equilibrium):均衡是所有參與人的最優(yōu)戰(zhàn)略的組合,一般記為s*=(s*1,…,s*i,…,s*n)其中,s*i是第i個(gè)參與人在均衡情況下的最優(yōu)戰(zhàn)略,它是i的所有可能戰(zhàn)略中ui或Eui最大化的戰(zhàn)略。博弈論中的均衡概念與一般均衡理論中市場供應(yīng)的均衡概念的區(qū)別。“均衡”和“均衡結(jié)果”(equilibriume)的區(qū)別,人們說“均衡”時(shí)他常常是指“均衡結(jié)果”。Static(orsimultaneous-move)gamesofcompleteinformation(完全信息靜態(tài)博弈)一個(gè)參與人集合(至少兩個(gè)參與人)每個(gè)參與人都有一個(gè)策略集/行動(dòng)集每個(gè)參與人針對策略組合,或者說對他所偏好的策略組合所獲得的收益{Player1,Player2,...Playern}S1S2...Snui(s1,s2,...sn),forall
s1
S1,s2
S2,...sn
Sn.一個(gè)靜態(tài)(或同時(shí)行動(dòng))博弈包括的要素:GameTheory--Chapter111同時(shí)行動(dòng)(Simultaneous-move)每個(gè)參與人在選擇他/她的策略時(shí)不知道其他參與人的選擇.完全信息(Completeinformation)每個(gè)參與人的策略和收益函數(shù)都是所有參與人的共同知識(shí)(commonknowledge).對參與人的假設(shè)理性(Rationality)參與人的目的是使他的收益最大化參與人是完美的計(jì)算者每個(gè)參與人都知道其他參與人是理性的Static(orsimultaneous-move)gamesofcompleteinformation(完全信息靜態(tài)博弈)參與人是否合作?不.我們僅僅考慮非合作博弈(non-cooperativegames)時(shí)間順序每個(gè)參與人
i
在不知道其他人的選擇的情況下選擇他/她的策略si.然后每個(gè)參與人
i
得到他/她的收益
ui(s1,s2,...,sn).博弈結(jié)束.Static(orsimultaneous-move)gamesofcompleteinformation(完全信息靜態(tài)博弈)1.1.2博弈的戰(zhàn)略式表述博弈的兩種不同的表述方式:戰(zhàn)略式表述(strategicformrepresentation)擴(kuò)展式表述(extensiveformrepresentation)戰(zhàn)略式表述更適合于靜態(tài)博弈,而擴(kuò)展式表述更適合于討論動(dòng)態(tài)博弈。戰(zhàn)略式表述又稱為標(biāo)準(zhǔn)式表述(normalformrepresentation),在這種表述中,所以參與人同時(shí)選擇各自的戰(zhàn)略,所有參與人選擇的戰(zhàn)略一起決定每個(gè)參與人的支付。更為準(zhǔn)確地講,戰(zhàn)略式表述給出:博弈的參與人集合:每個(gè)參與人的戰(zhàn)略空間:每個(gè)參與人的支付函數(shù):我們將用
代表戰(zhàn)略式表述博弈。在兩寡頭博弈里,企業(yè)是參與人,產(chǎn)量是戰(zhàn)略空間,利潤是支付;戰(zhàn)略式博弈為:這里,qi和πi分別是第i個(gè)企業(yè)的產(chǎn)量和利潤。一個(gè)博弈被稱為有限博弈(finitegame)
第一、參與人的個(gè)數(shù)是有限的;第二、每個(gè)參與人可選擇的戰(zhàn)略是有限的
兩人有限博弈的戰(zhàn)略式表述可以用矩陣表來直觀地給出。表1.1是房地產(chǎn)開發(fā)博弈中開發(fā)商A和B同時(shí)行動(dòng)博弈的戰(zhàn)略式表述開發(fā)商B開發(fā)不開發(fā)
開發(fā)商B開發(fā)不開發(fā)
開發(fā)商A開發(fā)不開發(fā)4000,40008000,00,80000,0-3000,-30001000,00,10000,0(a)高需求情況(b)低需求情況開發(fā)商A開發(fā)不開發(fā)如果完全靜態(tài)博弈是一種最簡單的博弈,在這種博弈中,由于每個(gè)人是在不知其他人行動(dòng)的情況下選擇自己的行動(dòng),戰(zhàn)略和行動(dòng)實(shí)際上是一回事。博弈分析的目的是預(yù)測博弈的均衡結(jié)果,即給定每個(gè)參與人都是理性的(rational)。納什均衡是完全信息靜態(tài)博弈解的一般概念,也是所有其他類型博弈解的基本要求。1.2納什均衡1.2.1占優(yōu)戰(zhàn)略均衡一個(gè)參與人的最優(yōu)戰(zhàn)略可能并不依賴于其他參與人的戰(zhàn)略選擇,就是說,不論其他參與人選擇什么戰(zhàn)略,他的最優(yōu)戰(zhàn)略是唯一的,這樣的最優(yōu)戰(zhàn)略被稱為“占優(yōu)戰(zhàn)略”(dominantstrategy).例如,“囚徒困境”。囚犯B坦白抵賴
坦白囚犯A
抵賴-8,-80,-10-10,0,-1,-1一般地,s*i稱為參與人i的(嚴(yán)格)占優(yōu)戰(zhàn)略,如果對應(yīng)所有的s-i,s*i是i的嚴(yán)格最優(yōu)選擇,即:對應(yīng)地,所有的
被稱為“劣戰(zhàn)略”(dominatedstrategies).記住,這里是i之外所有參與人戰(zhàn)略的組合。定義:
在博弈的戰(zhàn)略式表述中,如果對于所有的i,s*i是i的占優(yōu)戰(zhàn)略,那么,戰(zhàn)略組合
稱為占優(yōu)戰(zhàn)略均衡(dominant-strategyequilibrium)。占優(yōu)戰(zhàn)略均衡只要求每個(gè)參與人是理性的,而并不要求每個(gè)參與人知道其他參與人是理性的(也就是說,不要求“理性”是共同知識(shí))。囚徒困境反映了一個(gè)深刻的問題,即個(gè)人與團(tuán)體理性的沖突。這是合作博弈與非合作博弈的區(qū)別。1.2.2
重復(fù)剔除占優(yōu)均衡在每個(gè)參與人都有占優(yōu)戰(zhàn)略的情況下,占優(yōu)戰(zhàn)略均衡是一個(gè)非常合理的預(yù)測,但在絕大多數(shù)博弈中,占優(yōu)戰(zhàn)略均衡是不存在的。盡管如此,在有些博弈中,我們?nèi)钥梢詰?yīng)用占優(yōu)的邏輯找出均衡。在“智豬博弈”的例子中。顯然,這個(gè)博弈沒有占優(yōu)戰(zhàn)略均衡,所以不能應(yīng)用占優(yōu)戰(zhàn)略找出均衡。小豬按等待3,12,47,-1,0,0那么,什么是這個(gè)博弈的可能的均衡解呢?假定小豬是理性的,那么理性的小豬會(huì)選擇“等待”。再假定大豬知道小豬是理性的,那么大豬的最優(yōu)選擇只能是“按”。這是一個(gè)“多勞不多得,少勞不少得”的均衡。以上實(shí)際上是應(yīng)用了“重復(fù)剔除嚴(yán)格劣戰(zhàn)略”的思路
定義:令和是參與人i可選擇的兩個(gè)戰(zhàn)略(即)。如果對于任意的其他參與人的戰(zhàn)略組合,參與人從選擇得到的支付嚴(yán)格小于從選擇得到的支付,即:
我們說戰(zhàn)略嚴(yán)格劣于戰(zhàn)略(isstrictlydominatedby)。通常,
稱為相對于的劣戰(zhàn)略;對應(yīng)地,稱為相對于的優(yōu)戰(zhàn)略。占優(yōu)戰(zhàn)略均衡中的占優(yōu)戰(zhàn)略是相對于所有的占優(yōu)戰(zhàn)略。定義:
弱劣于戰(zhàn)略(
isstrictlydominatedby
),如果對于所有的,且對于某些嚴(yán)格不等式成立。稱為相對于的弱占優(yōu)戰(zhàn)略。
按大豬等待重復(fù)剔除的占優(yōu)均衡:戰(zhàn)略組合稱為重復(fù)剔除的占優(yōu)均衡,如果重復(fù)剔除劣戰(zhàn)略后剩下的唯一的戰(zhàn)略組合。如果這種唯一的戰(zhàn)略組合是存在的,我們說該博弈是重復(fù)剔除占優(yōu)可解的(dominantcesolvable)。一個(gè)抽象的例子:
在這個(gè)例子中,參與人A有兩個(gè)戰(zhàn)略:SA=(U,D),參與人B有三個(gè)戰(zhàn)略:SB=(L,M,R)。A的戰(zhàn)略中沒有一個(gè)嚴(yán)格優(yōu)于另一個(gè):如果B選擇L或M,U是最優(yōu)的(1>0),但如果B選擇R,D是最優(yōu)的(2>0)。然而,對B來說,M嚴(yán)格優(yōu)于R,故理性的參與人B不會(huì)選擇R。如果參與人A知道參與人B是理性的,R被剔除,A將選擇自己的戰(zhàn)略,似乎面對的是如表1.4(b)所代表的博弈。在這個(gè)新的中,U嚴(yán)格優(yōu)于D。這樣,如果B知道A是理性的,并且B知道A知道B是理性的(從而B知道1.4表(b)是適用的),D將被從其戰(zhàn)略中剔除,我們行到如表1.4(C)所示的博弈。這個(gè)博弈實(shí)際上是一個(gè)單人決策問題,M嚴(yán)格優(yōu)于L,L將被剔除。這樣,(U,M)是剩下的唯一的戰(zhàn)略組合。參與人BLM1,01,20,10,30,12,01,01,20,30,11,01,2參與人BLMR
參與人BLM參與人AU
D參與人AU
(a)(b)(c)參與人AU
D如果每次剔除的是嚴(yán)格,均衡結(jié)果與剔除的順序無關(guān)。如果的是弱劣戰(zhàn)略,均衡結(jié)果可能與剔除順序有關(guān)。如表1.5參與人BC1C2C32,121,101,120,120,100,110,120,100,13參與人的戰(zhàn)略空間越大,需要的步驟就越多,對共同知識(shí)的要求就越嚴(yán)格。由于這個(gè)原因,盡管在許多博弈中得利剔除的占優(yōu)均衡是一個(gè)合理的,但這一點(diǎn)并非總是如此,特別是當(dāng)支付取某些極端值的時(shí)候。參與人BLR
U參與人AD8,10-1000,97,66,5這個(gè)例子說明,在類似右表所示的博弈中,博弈的結(jié)果對行為的不確定性是很敏感的,即使是很小的不確定性。在單人決策分析里,只有一個(gè)決策人,他面臨的唯一不確定性是“自然”可能的行動(dòng),他對自然選擇不同行支的概率有一個(gè)固定的、外生的信念。相反,在博弈分析中,有多個(gè),每個(gè)決策人有關(guān)其他決策人的行為的信念并不是外生的。由于這個(gè)區(qū)別,許多我們所熟悉的決策論中的比較靜態(tài)結(jié)論并不能推廣到博弈論中。參見表1.7,1.8博弈分析與單人分析的一個(gè)重要區(qū)別
R1參與人AR2R31.2.3納什均衡納什均衡是完全信息博弈解的一般概念,構(gòu)成納什均衡的戰(zhàn)略一定是重復(fù)剔除嚴(yán)格劣過程中不能被剔除的戰(zhàn)略,就是說,沒有任何一個(gè)戰(zhàn)略嚴(yán)格優(yōu)于納什均衡戰(zhàn)略。定義:有n個(gè)參與人的戰(zhàn)略式表述博弈,戰(zhàn)略組合是一個(gè)納什均衡,如果對于每一個(gè)i,是給定其他參與人選擇的情況下第i個(gè)參與人的最優(yōu)戰(zhàn)略,即:或者用另一種表述方式,是下述最大化問題的解:(1)每一個(gè)占優(yōu)戰(zhàn)略均衡、重復(fù)剔除的占優(yōu)均衡一定是納什均衡,但并非每一個(gè)納什均衡都是占優(yōu)戰(zhàn)略均衡或重復(fù)剔除的占優(yōu)均衡。(2)納什均衡一定是在重復(fù)剔除嚴(yán)格劣戰(zhàn)略過程中沒有被剔除掉的戰(zhàn)略組合,但沒有被剔除戰(zhàn)略組合,不一定是納什均衡,除非它是唯一的。納什均衡與占優(yōu)戰(zhàn)略均衡及重復(fù)剔除的占優(yōu)均衡之間的關(guān)系。如果使用弱劣戰(zhàn)略剔除的辦法,均衡結(jié)果可能與剔除順序有關(guān)。例如:一個(gè)市場進(jìn)入的例子:有一個(gè)壟斷者已在市場上(稱為“在位者”),另一個(gè)企業(yè)虎視眈眈想進(jìn)入(稱為“進(jìn)入者”)。進(jìn)入者有兩可以選擇:(進(jìn)入,不進(jìn)入);在位者也有兩個(gè)戰(zhàn)略:(默許,斗爭)。假定進(jìn)入之前的壟斷利潤為300,進(jìn)入之后寡頭利潤為100,進(jìn)入成本為10。各種戰(zhàn)略組合下的支付矩陣如下表所示:
在位者默許 斗爭40,50-10,00,3000,300進(jìn)入進(jìn)入者不進(jìn)入這個(gè)例子說明,(弱)納什均衡允許弱劣戰(zhàn)略的存在納什均衡是參與人將如何博弈的“一致性”(consistent)預(yù)測:如果所有參與人預(yù)測一個(gè)特定的納什均衡將會(huì)出現(xiàn),那么,沒有人有興趣作不同的選擇從而,納什均衡且只有納什均衡具有這樣的特征:
參與人預(yù)測到均衡,參與人預(yù)測到其他參與人預(yù)測到均衡,等等1.3納什均衡應(yīng)用舉例1.3.1庫諾特(Cournot)寡頭競爭模型1.3.2豪泰林(Hotelling)價(jià)格競爭模型1.3.3公共地的悲劇1.3.4公共物品的私人自愿供給1.3.5基礎(chǔ)設(shè)施建設(shè):中央政府和地方政府之間的博弈
(不要求)1.3.1庫諾特(Cournot)雙寡頭競爭模型庫諾特寡頭競爭模型里,有兩個(gè)參與人,分別稱為企業(yè)1和企業(yè)2;每個(gè)企業(yè)的戰(zhàn)略是選擇產(chǎn)量;支付是利潤,它是兩個(gè)企業(yè)產(chǎn)量的函數(shù)是納什均衡產(chǎn)量意味著:找出納什均衡的一個(gè)辦法是對每個(gè)企業(yè)的利潤函數(shù)求一階導(dǎo)數(shù)并令其等于零:用代表第i個(gè)企業(yè)的產(chǎn)量,Ci(qi)代表成本函數(shù),P=P(q1+q2)代表逆需求函數(shù)(P是價(jià)格;Q(P)是原需求函數(shù))。第i個(gè)企業(yè)的利潤函數(shù)為:上述兩個(gè)一階條件分別定義了兩個(gè)反應(yīng)函數(shù)(reactionfunction):反應(yīng)函數(shù)意味著每個(gè)企業(yè)的最優(yōu)戰(zhàn)略(產(chǎn)量)是另一個(gè)企業(yè)產(chǎn)量的函數(shù)。兩個(gè)反應(yīng)函數(shù)的交叉點(diǎn)就是納什均衡R1(q2)R2(q1)NE為了得到更具體的結(jié)果,考慮上述模型的簡單情況。假定每個(gè)企業(yè)具有相同的單位成本,即:需求函數(shù)取如下線性形式:
那么,最優(yōu)化的一階條件分別為:反應(yīng)函數(shù)為:就是說,j每增加1個(gè)單位的產(chǎn)量,i將減少1/2單位的產(chǎn)量。解兩個(gè)反應(yīng)函數(shù),得納什均衡為:每個(gè)企業(yè)的納什均衡利潤分別為:為了與情況作比較,計(jì)算壟斷企業(yè)的最優(yōu)產(chǎn)量和均衡利潤。壟斷企業(yè)的問題是:最優(yōu)產(chǎn)量為:壟斷利潤為:思考結(jié)果是滿足這樣的:若一開始就假設(shè):結(jié)論是否仍然是(q待定)寡頭競爭的總產(chǎn)量大于壟斷產(chǎn)量的原因在于每個(gè)企事業(yè)在選擇自己的最優(yōu)產(chǎn)量時(shí),只考慮對本企業(yè)利潤的影響,而忽視對另一個(gè)企業(yè)的外部負(fù)效應(yīng)。這是典型的囚徒困境問題。庫諾特模型也可以使用重復(fù)剔除嚴(yán)格劣戰(zhàn)略的方法找出均衡解重復(fù)剔除嚴(yán)格劣戰(zhàn)略過程產(chǎn)生為唯一均衡,即納什均衡
在上述討論中,我們隱含地假定穩(wěn)定的均衡是存在的,且是唯一的,滿足這個(gè)要求的條件是,利潤函數(shù)是嚴(yán)格凹的交叉函數(shù)偏導(dǎo)數(shù)是負(fù)的此外,還要求兩曲線只交叉一次,且在交叉點(diǎn)R1比R2更陡。滿足這些條件的庫諾模型是重復(fù)剔除嚴(yán)格劣戰(zhàn)略可解的。如果這些條件不滿足,我們就無法用重復(fù)剔除的辦法找到均衡解。此外,如果存在3個(gè)以上的寡頭企業(yè),重復(fù)剔除也無法給出均衡解。這兩個(gè)條件意味著反應(yīng)函數(shù)R1和R2是斜率為負(fù)的連續(xù)函數(shù);補(bǔ)充:伯川德寡頭競爭模型(同質(zhì)產(chǎn)品)兩企業(yè)(企業(yè)1,企業(yè)2)進(jìn)行價(jià)格競爭,企業(yè)1價(jià)格p1,企業(yè)2價(jià)格p2,Ifp1<p2
,企業(yè)1的市場需求函數(shù)q1=a-p1企業(yè)2的市場需求函數(shù)為0;反之類似;If
p1=p2=p
,企業(yè)1,2的市場需求函數(shù)
q1=q2=(a-p)/2
邊際成本為常數(shù)c,c<a,兩個(gè)企業(yè)同時(shí)選擇價(jià)格,則納什均衡定價(jià)為c
.此時(shí),企業(yè)利潤為零,(BertrandParadox)
伯川德雙寡頭競爭模型(異質(zhì)產(chǎn)品)伯川德(Bertrand)(1983)Bertrand均衡(選擇產(chǎn)量)VsCournot均衡(選擇價(jià)格)企業(yè)1和2選擇價(jià)格P1
和P2,消費(fèi)者選擇對企業(yè)i
的產(chǎn)品的需求為:伯川德雙寡頭競爭模型(異質(zhì)產(chǎn)品)其中,b>0,企業(yè)的邊際成本為c,c<a,兩企業(yè)同時(shí)行動(dòng)。
均衡求解:企業(yè)i的利潤為:pi應(yīng)該是最優(yōu)化問題的解,因此,因此,伯川德雙寡頭競爭模型(異質(zhì)產(chǎn)品)1.3.2豪泰林(Hotelling)價(jià)格競爭模型Pi為商店i的價(jià)格,Di(p1,p2)為需求函數(shù),i=1,2。如果住在x的消費(fèi)者在兩個(gè)商店之間是無差異的,那么,所有住在x左邊的將都在商店1購買…需求分別為D1=x,D2=1-x。x滿足:“伯川德悖論”(BertrandParedox):即使只有兩個(gè)企業(yè),在均衡情況下,價(jià)格等于邊際成本,企業(yè)的利潤為零,與完全競爭商場均衡一樣。解決辦法之一是引入產(chǎn)品的差異性。空間上的差異(spacialdifferentiation),即經(jīng)典的豪泰林(hotelling)模型。物質(zhì)上有差異的模型(Bertrand寡頭競爭模型,Gibbons,P17)產(chǎn)品在物質(zhì)性能上是相同的,但在空間位置上有差異。因?yàn)椴煌恢蒙系南M(fèi)者要支付不同的運(yùn)輸成本??紤]兩商店之間價(jià)格競爭的納什均衡。解上式得需求函數(shù)分別為:利潤函數(shù)分別為:商店i選擇自己的價(jià)格pi最大化利潤,給定,兩個(gè)一階條件分別是:解上述兩個(gè)一階條件,得最優(yōu)解為:每個(gè)企事業(yè)的均衡利潤為:以上分析中,我們假定兩個(gè)商店分別位于城市的兩個(gè)極端。另一個(gè)極端的情況,假定兩個(gè)商店位于同一個(gè)位置x。,此時(shí),伯川德均衡是唯一的均衡:更為一般地,我們可以討論商店位于任何位置的情況。假定商店1位于,商店2位于(這里)。需求函數(shù)分別為:
,當(dāng)納什均衡為:當(dāng)時(shí),即為第一種情況:當(dāng)時(shí),為第二種情況:1.3.3公共地的悲劇這個(gè)例子證明,如果一種資源沒有排他性的所有權(quán),就會(huì)導(dǎo)致對這種資源的過度使用考慮一個(gè)有n個(gè)農(nóng)民的村莊共同擁有一片草地,每個(gè)農(nóng)民都有在草地上放牧的自由。每年春天,每個(gè)農(nóng)民要決定自己養(yǎng)多少只羊。用,代表第i個(gè)農(nóng)民飼養(yǎng)的數(shù)量,,代表n個(gè)農(nóng)民飼養(yǎng)的總數(shù)量;v代表每只羊的平均價(jià)值。v是G的函數(shù),一個(gè)重要的假設(shè)是最大可存活的數(shù)量:當(dāng)假定:如圖:每只羊的價(jià)值隨飼養(yǎng)總數(shù)量的增加而下降在這個(gè)博弈里,每個(gè)農(nóng)民的問題是選擇以最大化自己的利潤。假定購買一只羊羔的價(jià)格為c,那么,利潤函數(shù)為:
最優(yōu)化的一階條件是:上述n個(gè)一階條件定義了n個(gè)反應(yīng)函數(shù):因?yàn)樗约吹趇個(gè)農(nóng)民的最優(yōu)飼養(yǎng)量隨其它農(nóng)民的飼養(yǎng)量的增加遞減N個(gè)反應(yīng)函數(shù)的交叉點(diǎn)就納什均衡:納什均衡的總飼養(yǎng)量為將n個(gè)一階條件相加,得到:社會(huì)最優(yōu)的目標(biāo)是最大化如下定義的社會(huì)總剩余價(jià)值:最優(yōu)化的一階條件為:比較社會(huì)最優(yōu)的一階條件與個(gè)人最優(yōu)的一階條件可以看到:這就是公共地的悲劇。推導(dǎo)過程?比較的方法1.3.4公共物品的私人自愿供給公共物品的私人自愿供給會(huì)導(dǎo)致供給不足。設(shè)想一個(gè)由n個(gè)居民組成的社團(tuán)正建設(shè)一座防洪大堤的情況……第i個(gè)居民的貢獻(xiàn)為gi,總供給為。i的效用函數(shù)為,這里是私人物品的消費(fèi)量。假定,且私人物品和公共物品之間的邊際替代率是遞減的。令為私人物品的價(jià)格,為沙袋的價(jià)格,為個(gè)人總預(yù)算收入。那么,每個(gè)居民面臨的問題是給定其他居民的選擇的情況下,選擇自己的最優(yōu)戰(zhàn)略以最大化下列目標(biāo)函數(shù):最優(yōu)化的一階條件為:故假定其他人的選擇給定。n個(gè)均衡條件決定了公共物品自愿供給的納什均衡:考慮帕累托(Pareto)最優(yōu)解。假定社會(huì)福利函數(shù)采取下列形式:總預(yù)算約束為:帕累托最優(yōu)的一階條件是用n個(gè)等式消除掉,我們得到均衡條件:這就是存在公共物品情況下帕累托最優(yōu)的薩繆爾遜條件。上述條件可重寫為:結(jié)論:Pareto最優(yōu)供給>Nash均衡供給假定個(gè)人效用函數(shù)取柯布-道格拉斯形式,即這里,則個(gè)人最優(yōu)的均衡條件為:將預(yù)算條件代入整理,得反應(yīng)函數(shù)為一般地,如果所有居民有相同的收入水平M,均衡情況下所有居民提供相同的公共物品,納什均衡為:納什均衡的總供給為:在所有人具有相同收入的假設(shè)下,帕累托最優(yōu)的一階條件為:將預(yù)算約束代入,得到單個(gè)人的帕累托最優(yōu)貢獻(xiàn)為公共物品的總供給為:納什均衡的總供給與帕累托最優(yōu)的總供給的比率為:就是說,公共物品的納什均衡供給小于帕累托最優(yōu)供給,且二者之間的差距隨著社區(qū)居民人數(shù)的增加而擴(kuò)大。此外,供給不足的程度會(huì)隨著收入分配差距的擴(kuò)大而減弱(Olson,1982)。比如說,假定社區(qū)由兩人組成,如果,納什均衡為:納什均衡總供給為:對比這下,如果居民1的收入是居民2的2倍即,假定,納什均衡為:容易驗(yàn)證,收入平均分配下的納什均衡總供給小于收入分配不均時(shí)的納什均衡供給:上述例子表明,當(dāng)收入分配不平均時(shí),公共物品的自愿供給可能變成一個(gè)智豬博弈。在有些情況下,公共物品的提供也可能變成一個(gè)斗雞博弈問題。如下:公共物品的斗雞博弈
富人B修不修
富人A修不修1.3.5基礎(chǔ)設(shè)施建設(shè):
中央政府和地方政府之間的博弈3,32,44,21,1總結(jié):公共物品的供給可能是一個(gè)囚徒困境問題,也可能是智豬博弈問題,還可能是一個(gè)斗雞博弈問題,依環(huán)境而定。靜態(tài)博弈分析解釋中央政府和地方政府基礎(chǔ)設(shè)施建設(shè)上的博弈:假定中央政府和地方政府投資的收益函數(shù)分別取如下柯布-道格拉斯形式:中央政府:地方政府:
用和分別代表中央政府和地方政府可用于投資的總預(yù)算資金。假定中央政府和地方政府的都是在滿足預(yù)算約束的前提下最大化各自的收益函數(shù)。那么,中央政府的問題是:地方政府的問題是:解之,得反應(yīng)函數(shù)分別為:中央政府:地方政府:上述反應(yīng)意味著:
Odbca圖1.4基礎(chǔ)設(shè)施投資的博弈即在均衡點(diǎn),至少有一方的最優(yōu)解是角點(diǎn)解。
代表中央政府的反應(yīng)曲線,代表地方政府的反應(yīng)曲線;使用重復(fù)剔除嚴(yán)格劣戰(zhàn)略的方法,經(jīng)過不斷重復(fù)剔除,(0,OC)是唯一剩下的戰(zhàn)略組合。命題1:如果納什均衡是:,即地方政府將全部資金投資于加工業(yè),中央政府滿足所有基礎(chǔ)設(shè)施投資的需求,然后將剩余資金投資于加工業(yè)??紤] 的情況。
使用圖1.4容易證明:命題2:如果,納什均衡為:納什均衡為:即地方政府將全部資金投資于加工業(yè),中央政府將全部資金投資于基礎(chǔ)設(shè)施。再考慮的情況,有:命題3:如果,納什均衡為:即中央政府將全部資金投資于基礎(chǔ)設(shè)施建設(shè),地方政府“彌補(bǔ)”中央投資的不足直到地主政府的理想狀態(tài),然后將剩余資金投資于加工業(yè)。綜合上述三種情況,在第一種情況下,投資資金的分配格局滿足了中央政府的偏好:在第二種情況下,投資資金的分配格局介于中央政府的偏好和地方政府的偏好之間:在第三種情況下,投資資金的分配格局滿足了地方政府和偏好:上述模型大致可以解釋改革開放以來中國基礎(chǔ)設(shè)施投資格局的變化過程
1.4混合戰(zhàn)略納什均衡-1,11,-11,-1-1,1在前面,我們將納什均衡定義為一組滿足所有參與人的效用最大化要求的戰(zhàn)略組合,根據(jù)這一定義,有些博弈不存在納什均衡。考慮下面兩個(gè)例子:流浪漢尋找工作游蕩
政府救濟(jì)不救濟(jì)3,2-1,3-1,10,0兒童B正面反面兒童A正面反面社會(huì)福利博弈猜謎游戲
上述兩個(gè)博弈的顯著特征是,每一個(gè)參與人都想猜透對方的戰(zhàn)略,而每一個(gè)參與人又都不能讓對方猜透自己的戰(zhàn)略。在這類博弈中,都不存在納什均衡。如果一個(gè)戰(zhàn)略規(guī)定參與人在每一個(gè)給定的信息情況下只選擇一種特定的行動(dòng),我們稱該戰(zhàn)略為。相反,如果一個(gè)戰(zhàn)略規(guī)定參與人在給定信息情況下以某種概率分布隨機(jī)地選擇不同的行動(dòng),我們稱該戰(zhàn)略為。在博弈的戰(zhàn)略式表述中,混合戰(zhàn)略可以定義為在純戰(zhàn)略空間上的概率分布。在靜態(tài)博弈里,純戰(zhàn)略等價(jià)于特定的行動(dòng),混合戰(zhàn)略是不同行動(dòng)之間的隨機(jī)選擇。純戰(zhàn)略混合戰(zhàn)略定義:在n個(gè)參與人博弈的戰(zhàn)略式表述中,假定參與人i有K個(gè)純戰(zhàn)略:,那么,概率分布稱為i的一個(gè)混合戰(zhàn)略,這里是i選擇的概率,對于所有的使用上述定義,純戰(zhàn)略可以理解為混合戰(zhàn)略的特例。((用代表i的混合戰(zhàn)略空間代表混合戰(zhàn)略空間組合,其中為的一個(gè)混合戰(zhàn)略,代表混合戰(zhàn)略組合空間。))重新定義納什均衡:定義:在n個(gè)參與人博弈的戰(zhàn)略式表述中,混合戰(zhàn)略組合是一個(gè)納什均衡,如果對于所有的下式成立:納什均衡也可以表述如下:定義:是一個(gè)納什均衡,如果對于所有的參與人i,以社會(huì)福利博弈為例求解混合戰(zhàn)略納什均衡假定政府的混合戰(zhàn)略為,流浪漢的混合戰(zhàn)略為政府的期望效用函數(shù)為:對上述效用函數(shù)求微分,得到政府最優(yōu)化的一階條件為:因此,即,在混合戰(zhàn)略均衡中,流浪漢以0.2的概率選擇尋找工作,以0.8的概率選擇游蕩。為了找出政府的均衡混合戰(zhàn)略,我們需要求解流浪漢的最優(yōu)化問題。給定流浪漢的期望效用函數(shù)為:最優(yōu)化的一階條件為:因此我們可以使用反應(yīng)對應(yīng)的概念來描述一個(gè)參與人對應(yīng)與其他參與人混合戰(zhàn)略的最優(yōu)選擇。在上述博弈中,政府和流浪漢的反應(yīng)對應(yīng)分別為:政府:流浪漢:
0.20.5
11圖1.5混合戰(zhàn)略納什均衡海薩尼對混合戰(zhàn)略的解釋是,混合戰(zhàn)略均衡等價(jià)于不完全信息下的純戰(zhàn)略均衡。盡管混合戰(zhàn)略不像純戰(zhàn)略那樣直觀,但它確實(shí)是一些博弈中參與人的合理行為方式。經(jīng)注學(xué)上的監(jiān)督博弈也是這樣的一個(gè)例子:給定,納稅人選擇逃稅和不逃稅的期望收益分別為:用代表稅收機(jī)關(guān)檢查的概率,代表納稅人逃稅的概率。給定,稅收機(jī)關(guān)選擇檢查和不檢查的期望收益分別為:監(jiān)督博弈表1.14概括了對應(yīng)不同純戰(zhàn)略組合的支付矩陣。納稅人逃稅 不逃稅稅收機(jī)關(guān)檢查不檢a-C+F,-a-Fa-C,-a0,0a,-a解,得:解得:因此,混合戰(zhàn)略納什均衡是:
以上討論的是不存在純戰(zhàn)略納什均衡但存在混合戰(zhàn)略納什均衡的博弈。有些博弈既存在純戰(zhàn)略均衡,也存在混合戰(zhàn)略均衡。所謂的“性別戰(zhàn)”就是這樣一個(gè)博弈。女足球芭蕾男足球2,10,0芭蕾0,01,2這個(gè)博弈有兩個(gè)純戰(zhàn)略納什均衡:(足球,足球),(芭蕾,芭蕾)。事實(shí)上,這個(gè)博弈還有一個(gè)混合戰(zhàn)略納什均衡:男的以2/3的概率選擇足球賽,1/3
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 四川電影電視學(xué)院《大學(xué)生創(chuàng)新創(chuàng)業(yè)教育》2021-2022學(xué)年第一學(xué)期期末試卷
- 石河子大學(xué)《智能檢測與計(jì)算機(jī)控制技術(shù)》2021-2022學(xué)年期末試卷
- 正念減壓治療與腫瘤康復(fù)
- 石河子大學(xué)《外科學(xué)二見習(xí)》2021-2022學(xué)年第一學(xué)期期末試卷
- 石河子大學(xué)《軟件測試技術(shù)》2022-2023學(xué)年期末試卷
- 石河子大學(xué)《化工原理實(shí)驗(yàn)二》2023-2024學(xué)年第一學(xué)期期末試卷
- 沈陽理工大學(xué)《智能產(chǎn)品交互設(shè)計(jì)》2023-2024學(xué)年第一學(xué)期期末試卷
- 沈陽理工大學(xué)《現(xiàn)代控制理論》2022-2023學(xué)年期末試卷
- 沈陽理工大學(xué)《計(jì)算機(jī)圖形學(xué)》2023-2024學(xué)年第一學(xué)期期末試卷
- 沈陽理工大學(xué)《工業(yè)機(jī)器人》2023-2024學(xué)年第一學(xué)期期末試卷
- 充電樁整體解決方案PPT幻燈片(PPT 27頁)
- 物業(yè)服務(wù)集團(tuán)全員品質(zhì)督導(dǎo)策劃方案
- 建筑設(shè)計(jì)基礎(chǔ)(ppt)課件
- 半導(dǎo)體芯片項(xiàng)目商業(yè)計(jì)劃書范文參考
- 邯鄲市政府采購辦事指南
- 城市初期雨水污染治理
- 在護(hù)林員培訓(xùn)班上的講話護(hù)林員會(huì)議講話稿.doc
- 材料科學(xué)基礎(chǔ)-第7章-三元相圖
- (完整word版)高頻變壓器的設(shè)計(jì)
- 公路工程2018各項(xiàng)費(fèi)用的計(jì)算程序及計(jì)算方式
- 戶外急救知識(shí)(必備)
評論
0/150
提交評論